Mistral AI har lansert sin OCR API, et verktøy designet for å konvertere komplekse PDF-dokumenter til strukturert markdown, og effektivisere integrasjonen med AI-arbeidsflyter.
Utgivelsen forbedrer automatisering for utviklere og bedrifter som behandler dokumenttunget-prosesser, og tilbyr en strukturert utgang som eliminerer behovet for manuell formating. OCR
I henhold til benchmarks som er delt av Mistral, har OCR-modellen vist den høyeste generelle nøyaktigheten blant ledende OCR-modeller i referansetester, og overgår konkurrenter som Google Document AI, Azure OCR, Gemini-1.5-FLASH-002 og Openai’s Gpt-4o-gemini. src=”https://winbuzzer.com/wp-content/uploads/2024/07/mistral-ai-home-eie.jpg”>
Det fører i matematikkgjenkjenning med en nøyaktighet på 94,29, outperforming Gemini-1,5-flash-002, som følger med 89.1. I flerspråklig støtte scorer Mistral OCR 2503 89.55, rangert over Azure OCR på 87.52 og GPT-4O på 86.00.
Modellen dominerer også skannet dokumentnøyaktighet, og oppnår 95.96, brønn foran Gemini-2-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-PRO-Når det gjelder tabellutvinning, når Mistral OCR 96.12, og overstiger betydelig GPT-4O ved 91.70 og Gemini-2.0-FLASH-001 på 91.46. Med en generell nøyaktighet på 94.89, leder den alle andre modeller, og overgår sin nærmeste konkurrent, Gemini-1.5-Flash-002, som scoret 90.23.
Acoording til selskapet, “Å være lettere vekt enn de fleste modeller i kategorien, Mistral OCR utfører betydelig raskere enn sine jevnaldrende, behandler opp til 2000 sider på et minutt på en en-en-en. Evnen til raskt å behandle dokumenter sikrer kontinuerlig læring og forbedring, selv for miljøer med høy gjennomstrømning.”
utover tradisjonell OCR: Ai-klar markdown
I motsetning til standard OCR-verktøy, som trekker ut uformatt tekst, strukturerer Mistrals API direkte innhold i Markdown. Bedriften har
Mistrals push inn i dokument AI ble asfaltert av sitt arbeid på PixTral 12b, en multimodal modell utgitt i september 2024. Den ble fulgt av PixTral stor i november, en 124 milliarder dollar-parameter modell bygget for high context-dokument. Disse modellene setter grunnlaget for strukturert datatolkning, nå utnyttet i den nye OCR API. Før han fremmet OCR-evner, hadde Mistral allerede flyttet fokus til mindre, mer effektive modeller for lokal AI-prosessering. I oktober 2024 introduserte det ministral 3B og Ministral 8B, optimalisert for personvernbevisste, offline AI-applikasjoner. Disse modellene fikk trekkraft i bransjer som krever inferanse på enheter, for eksempel finansinstitusjoner og helsepersonell som håndterer sensitive data. utvidet dette fokuset, lanserte Mistral Mistral Small 3 i januar, en åpen kildekode LLM designet for å konkurrere med Openais GPT-4O Mini. Selskapet rapporterte at det oppnådde”over 81% på MMLU-referansen”, og demonstrerte sterk nøyaktighet med lavere beregningskrav. I motsetning til større skyavhengige modeller, kan Small 3 kjøres effektivt på forbrukermaskinvare, og forsterker Mistrals vektlegging av AI-løsninger. /Strong> Expand Enterty-tilbud med MOD-MODTS. Enterprise-fokuserte AI-verktøy inkluderer også innholdsmoderasjonsløsninger, som ble lansert i november 2024. Bygget på ministal 8B-modellen, støtter Mistral Content Moderation API flerspråklig moderasjon på elleve språk, filtrering av skadelig innhold som hatefulle og personlige data. Utvidede Le Chats automatiseringsfunksjoner med AI-agenter, effektiviserer profesjonelle arbeidsflyter gjennom automatisk e-postoppsummering, rapportutarbeidelse og dokumentanalyse. I januar forbereder administrerende direktør Arthur Mensch på World Economic Forum at Mistral AI forbereder seg på en IPO, og forsterker sine langtidsvekstplaner. I et intervju med Bloomberg uttalte han:”Vi er ikke til salg Den innledende frørunden på 113 millioner styrket også sin bedriftsappell gjennom strategiske partnerskap. I tillegg er dets partnerskap med Qualcomm href=”https://news.sap.com/2024/10/sap-mistral-ai-partnership-expands-broaden-customer-valg/”> sap har støttet distribusjon på spesialposisjonen til å bli i//tsrongt> Mens Openai, Google og Meta fortsetter å skalere opp stadig store modeller, har Mistral tatt en annen tilnærming. I stedet for å prioritere maksimale parametertellinger, har selskapet fokusert på å gjøre modeller effektive, lokalt distribuerbare og tilpasningsdyktige for både sky-og offline miljøer. Denne strategien har vært spesielt tydelig med suksessen til ministral 3B, Ministral 8B og Mistral Small 3, og tilbyr alternativer som krever færre beregningsressurser mens du opprettholder høy nøyaktighet. Mistrals Modell har blitt designet for strukturert innholdsarbeid, og tilbyr ANI-GENERATED MERKDOWDOWDS-formating, RealTime Tools, med å være. OCR API-lanseringen, Mistral utvider fokuset utover Standard Conversational AI. Ved å automatisere konvertering av PDF-er til strukturerte AI-kompatible formater, fjerner den flaskehalser i juridiske, økonomiske og forskningsdrevne næringer. AI-drevet dokumentbehandling har vært et område med økende etterspørsel, og evnen til å direkte strukturere tekst til markdown skiller Mistral fra løsninger som bare trekker ut rå tekst uten organisering. Denne utgivelsen binder seg også til Mistrals bredere AI-assistentstrategi. Funksjoner som Le Chats sanntidssøk og automatisert oppgavestyring gjør det til et allsidig alternativ til Openais ChatGPT-foretak og Googles AI-drevne arbeidsområdeverktøy.