Mistral AI uruchomił API OCR, narzędzie zaprojektowane do konwersji złożonych dokumentów PDF na strukturę, usprawniając integrację z przepływami pracy AI.

Wydanie zwiększa automatyzację programistów i firm zajmujących się procesami wyceniania dokumentów, oferując strukturę wydajną, która eliminuje zapotrzebowanie na ręczne formatowanie.

wykonywanie procesów Google i otwartej wersji i otwartej produkcji i otwartej wydajności. OCR

Według testów porównawczych udostępnionych przez Mistral IT Model OCR wykazał najwyższą ogólną dokładność wśród wiodących modeli OCR w testach porównawczych, przewyższając konkurentów, takich jak dokument Google AI, Azure OCR, Gemini-1.5-Flash-002, i OpenAI GPT-4O w wielu kategoriach wydajności. src=”https://winbuzzer.com/wp-content/uploads/2024/07/mistral-ai-home-own.jpg”>

Prowadzi to w rozpoznawaniu matematyki z dokładnością 94,29, przewyższając Gemini-1.5-flash-002, który następuje na 89,11. W wsparciu wielojęzycznym Mistral OCR 2503 wyniki 89,55, ranking powyżej Azure OCR na 87,52 i GPT-4O przy 86,00.

Model dominuje również w skanowanej dokładności dokumentów, osiągając 98,96, na czele Gemini-1.5-Pro-002 w 96.15 i Gemini-2,0-001 w 95.11. Jeśli chodzi o ekstrakcję tabeli, Mistral OCR osiąga 96,12, znacznie przekraczając GPT-4O przy 91,70 i Gemini-2,0-Flash-001 przy 91,46. Z ogólną dokładnością 94,89, prowadzi wszystkie inne modele, przewyższając jego najbliższego konkurentów, Gemini-1.5-Flash-002, który uzyskał 90.23.

ModelAllMathMultilyalcangableSTabeSgoogle Dokument AI83.4280.2986.4292.7778.16azy. OCR89.5285.7287.5294.6589.52gemini-1.5-Flash-00290.2389.1186.7694.8790.48gemini-1.5-Pro-00289.9288.4886.3 396.1589.71 Gemini-2,0-flash-00188.6984.1885.8095.1191.46GPT-4O-2024-11-2089.7787.5586.0094.5891.70mistral OCR 2503 94,89 94,29 89,55 98.96 96.12

Te wyniki wskazują, że błąd OCR 2503 jest najbardziej zaawansowanym rozwiązaniem w swojej kategorii, doskonałości w przekazywaniu kompleksowych struktur dokumentów, treści matematycznej, wieloskładnikowej i strukturalnej wersji. Ustawia nowy standard dla wydajności OCR z napędem AI, oferując wyższą dokładność i bardziej niezawodną konwersję tekstu w porównaniu z innymi modelami w terenie.

Acoording do firmy, „będąc mniejszą wagą niż większość modeli w kategorii, Mistral OCR działa znacznie szybciej niż jej rówieśnicy, przetwarzając do 2000 stron na minutę na jednej klamrze. Zdolność do szybkiego przetwarzania dokumentów zapewnia ciągłe uczenie się i ulepszanie nawet w środowiskach o wysokiej przepustowości. „

Poza tradycyjnymi OCR: AI-gotowe Markdown

Niezależnie od standardowych narzędzi OCR, które wyodrębniają nieoformowany tekst, API Mistrala bezpośrednio struktury struktury marki. href=”https://mistral.ai/fr/news/mistral-ocr”> Ogłoszenie Podkreśla, że ​​API dokładnie interpretuje tabele, formuły i złożone elementy dokumentów, co nadaje się do automatyzacji AI-Periven. Ewolucja platformy LE CHAT, która otrzymała poważne aktualizacje w listopadzie 2024 r. Obejmowały one integrację wyszukiwania w czasie rzeczywistym i edytowanie dokumentów współpracy za pośrednictwem Canvas, pozycjonując ją jako konkurenta w pakiecie produktywności napędzanych przez AI.

Asystent zintegrowany Flux Pro, model generowania obrazu z Black Forest Labs, wzmacniając swoje kreatywne możliwości. Droga do zaawansowanego przetwarzania dokumentów

Wpychanie Mistral do dokumentu AI utwardzono przez jego prace nad Pixtral 12B, modelem multimodalnym wydanym we wrześniu 2024 r. Po tym, jak w listopadzie, wspierał parsowanie o dużej skali, które wspierało parsowanie o dużej skali. Modele te ustanowiły podstawę strukturalnej interpretacji danych, obecnie wykorzystanych w nowym interfejsie API OCR.

Przed osiągnięciem możliwości OCR, Mistral już przeniósł ostrość na mniejsze, bardziej wydajne modele do lokalnej przetwarzania AI. W październiku 2024 r. Wprowadził Ministral 3B i Ministral 8B, zoptymalizowane pod kątem świadomości prywatności, offline AI. Modele te zyskały przyczepność w branżach wymagających wnioskowania na urządzenie, takie jak instytucje finansowe i świadczeniodawcy opieki zdrowotnej obsługujące wrażliwe dane.

Rozszerzając ten skupienie, Mistral uruchomił Mistral Small 3 w styczniu, LLM open source zaprojektowany w celu rywalizacji z Mini GPT-4O Openai. Firma poinformowała, że ​​osiągnęła „ponad 81% w odniesieniu MMLU”, „wykazując silną dokładność z niższymi wymaganiami obliczeniowymi. W przeciwieństwie do większych modeli zależnych od chmury, małe 3 może działać wydajnie na sprzęcie konsumowym, wzmacniając nacisk Mistrala na temat dostępnych rozwiązań AI.

rozszerzenie ofert przedsiębiorstwa. Narzędzia AI skoncentrowane na przedsiębiorstwie obejmują również rozwiązania dotyczące moderacji treści, uruchomione w listopadzie 2024 r. Zbudowane na modelu ministralu 8b, Mistral Content Moderacja API obsługuje moderację wielojęzyczną dla jedenastu języków, a przybliżenie o 25%w języku. Firma rozszerzyła możliwości automatyzacji LE z agentami AI, usprawniając profesjonalne przepływy pracy poprzez automatyczne podsumowanie e-maili, opracowywanie raportów i analizę dokumentów.

W styczniu, dyrektor generalny Arthur Mensch potwierdził na światowym forum ekonomicznym, że Mistral AI przygotowuje się do IPO, wzmacniając swoje długoterminowe plany rozwoju. W wywiadzie dla Bloomberga stwierdził: „Nie jesteśmy na sprzedaż”. Od tego czasu firma rozszerzyła działalność na Azję i Pacyfik, otwierając regionalne biuro w Singapurze w celu ustalenia przyczółka na rozwijających się rynkach AI.

Wzrost inwestycji i strategiczne partnerstwa

Mistral ai. Początkowa runda nasion o wartości 113 milionów dolarów była jedną z największych w europejskiej historii AI, a na początku 2025 r. Całkowite finansowanie przekroczyło 1,1 miliarda dolarów.

wspierane przez firmy takie jak Andreessen Horowitz, General Catalyst i Lightspeed Venture Partners, spółka postawiła się jako kluczowy konkurent w ogólnej przestrzeni AI. Wzmocniło także swój atrakcyjność przedsiębiorstw poprzez strategiczne partnerstwa. Dodatkowo, jego partnerstwa z Qualcomm i sap wspierali wdrożenie specjalistycznego sprzętu i zapewniono zgodność z europejskimi przepisami dotyczącymi prywatności.

Podczas gdy Openai, Google i Meta nadal skalowują coraz większe modele, Mistral przyjął inne podejście. Zamiast priorytetyzować maksymalną liczbę parametrów, firma koncentrowała się na tworzeniu modeli wydajności, lokalnie wdrażania i dostosowania zarówno dla środowisk chmurowych, jak i offline.

Ta strategia była szczególnie widoczna wraz z powodzeniem Ministral 3B, Ministral 8B i Mistral Small 3, oferując alternatywy, które wymagają mniejszej liczby zasobów obliczeniowych przy jednoczesnym zachowaniu wysokiej dokładności.

Modele Mistral zostały zaprojektowane pod kątem strukturalnych przepływów pracy treści, oferującego zwolnione z funkcji AI-generowane formatyki w czasie rzeczywistym, a integrację z platformami automatyki biznesowej.

Wraz z uruchomieniem API OCR Mistral rozszerza swój skupienie poza standardową sztuczną inteligencję konwersacyjną. Automatyzując konwersję plików PDF w ustrukturyzowane formaty kompatybilne z AI, usuwa wąskie gardła w branżach prawnych, finansowych i badawczych. Przetwarzanie dokumentów z napędem AI było obszarem rosnącego popytu, a zdolność do bezpośredniej struktury tekstu w zestawie markdown jest Mistral oprócz rozwiązań, które wyciągają surowy tekst bez organizacji.

To wydanie wiąże się również z szerszą strategią asystenta AI Mistral. Funkcje takie jak wyszukiwanie w czasie rzeczywistym Le Chat i zautomatyzowane zarządzanie zadaniami sprawiają, że jest to wszechstronna alternatywa dla Chatgpt Enterprise Openai i narzędzia przestrzeni roboczej z napędem AI.

Categories: IT Info