Mistral AI hat ihre OCR-API auf den Markt gebracht, ein Tool zum Umwandeln komplexer PDF-Dokumente in strukturiertes Markdown und die Straffung der Integration mit KI-Workflows. OCR

Laut Benchmarks, die von Mistral IT IT IT-OCR-Modell geteilt wurden, hat die höchste Gesamtgenauigkeit unter den führenden OCR-Modellen in Benchmark-Tests gezeigt, die Konkurrenten wie Google Document AI, Azure OCR, Gemini-1,5-Flash-002-und OpenAI-GPT-4O-Kategorien für die GTEL-4O-Kategorien von OpenAI und OpenAI-IM-4-O-4o-Kategorien für die Multipler-Performance-Kategorien. src=”https://winbuzer.com/wp-content/uploads/2024/07/mistal-ai-home-own.jpg”In mehrsprachiger Unterstützung bewertet Mistral OCR 2503 89,55, die über Azure OCR bei 87,52 und GPT-4O bei 86,00 rangieren. Wenn es um die Tabellenextraktion geht, erreicht Mistral OCR 96,12 und überschreitet GPT-4O bei 91,70 und Gemini-2,0-Flash-001 bei 91,46 erheblich. Mit einer Gesamtgenauigkeit von 94,89 führt es alle anderen Modelle an, die seinen engsten Konkurrenten, Gemini-1,5-Flash-002, übertrifft. 89,52 Gemini-1,5-Flash-002 90,23 89.11 86,76 94.87 90,48 Gemini-1,5-pro2 89.92 88.48 86,33 96,15 89.71 Gemini-2,0-Flash-001 88.69 84.18 85.85.85.80 95.11 91.461 88.69 84.18 85.85.80 95.11 91.461.88.69 84.18 85.85.80 95.11 91.461.88.69 84.18 85.85.80 95.11 91.46. GPT-4O-2024-11-20 89.77 87,55 86.00 94.58 91.70 Mistral OCR 2503 94,89 94,29 89.55 98.96 advanced> advanced advanced> advanced advanced advanced advanced advanced advanced advancy advorg advorg advorg advorg. Lösung in seiner Kategorie, Exzellent in den Umgang mit komplexen Dokumentstrukturen, mathematischen Inhalten, mehrsprachiger Text und strukturierter Datenextraktion. Es setzt einen neuen Standard für die AI-betriebene OCR-Leistung und bietet im Vergleich zu anderen Modellen im Feld höhere Genauigkeit und zuverlässigere Textumwandlung. Die Fähigkeit, schnell zu verarbeiten Dokumente, sorgt für kontinuierliches Lernen und Verbesserung selbst für Hochdurchsatzumgebungen.”href=”https://mistal.ai/fr/news/mistal-ocR”Ankündigung Highlights, dass die API Tabellen genau interpretiert, die für komplexe Dokumentelemente für die AI-Driven-Automatisierung der Vorbereitungen in multimodaler AI-Mise, einschließlich der Pixiermodell-Leine. Die Dokumentverarbeitung folgt der Entwicklung seiner LE-Chat-Plattform, die im November 2024 große Aktualisierungen erhielt. Dazu gehörten die Integration von Websuche in Echtzeit und die kollaborative Dokumentbearbeitung über Leinwand, wobei sie als Konkurrenz zu AI-gesteuerten Produktivitäts-Suiten positioniert wurden. und der Weg zur erweiterten Dokumentenverarbeitung

Mistral’s Push in Dokument AI wurde durch seine Arbeiten an Pixtral 12b, einem im September 2024 veröffentlichten multimodalen Modell, gepflastert. Es folgte von Pixtral Large im November, einem 124-Milliarden-Parameter-Modell, das für eine hohe Kontext-Dokumentation aufgebaut wurde. Diese Modelle legten die Grundlage für die strukturierte Dateninterpretation, die jetzt in der neuen OCR-API eingesetzt wurde. Im Oktober 2024 wurde Ministral 3B und Ministral 8B eingeführt, die für die von Privatsphäre bewusste Offline-AI-Anwendungen optimiert wurden. Diese Modelle erlangten in Branchen, die Inferenz für das Gerät erforderten, wie Finanzinstitute und Gesundheitsdienstleister, die sensible Daten bearbeiten. Das Unternehmen berichtete, dass es „über 81% an der MMLU-Benchmark“ erreichte, was eine starke Genauigkeit bei niedrigeren Rechenanforderungen zeigt. Im Gegensatz zu größeren Cloud-abhängigen Modellen kann Small 3 auf Verbraucherhardware effizient abschneiden, was die Betonung von Mistal-Mistrial-Mistrial-Mistrial-Mistrial-Mistrial-Missergästen mit Messenen von AI-Lösungen verstärkt. Enterprise-fokussierte KI-Tools umfassen auch Inhalts Moderationslösungen, die im November 2024 gestartet wurden. Die auf dem Ministral 8B-Modell basierende API von Mistral Inhalts Moderation unterstützt die mehrsprachige Moderation über elf Sprachen, die schädliche Inhalte wie Hassreden und personenbezogene Daten ausgesetzt sind. Das Unternehmen erweiterte die Automatisierungsfunktionen von LE CHAT mit KI-Agenten, stromlinierende professionelle Workflows durch automatische E-Mail-Zusammenfassung, Berichtsabarbeitung und Dokumentenanalyse. In einem Interview mit Bloomberg erklärte er: „Wir sind nicht zum Verkauf.“ Das Unternehmen hat seitdem den Betrieb in asiatisch-pazifik erweitert und ein regionales Büro in Singapur eröffnet, um den Anbau von KI-Märkten zu schaffen. Die anfängliche Saatgut-Runde in Höhe von 113 Millionen US-Dollar war eine der größten in der europäischen KI-Geschichte, und bis zu Beginn 2025 übertraf die Gesamtfinanzierung 1,1 Milliarde US-Dollar. Außerdem hat eine Enterprise-Attraktivität durch strategische Partnerschaften gestärkt. Additionally, its partnerships with Qualcomm and SAP haben die Bereitstellung auf spezialisierten Hardware und die Einhaltung der europäischen Datenschutzbestimmungen unterstützt. Positionierung

Während OpenAI, Google und Meta weiterhin zunehmend große Modelle verkleinern, hat Mistral einen anderen Ansatz gewählt. Anstatt die maximalen Parameterzahlen zu priorisieren, hat sich das Unternehmen darauf konzentriert, Modelle effizient, lokal einsetzbar und für Cloud-und Offline-Umgebungen anpassbar zu machen.

Diese Strategie wurde besonders mit dem Erfolg von Ministral 3B, Ministral 8B und Mistral Small 3 ersichtlich und bietet Alternativen, die weniger Rechenressourcen erfordern und gleichzeitig eine hohe Genauigkeit aufrechterhalten. OCR-API-Start, Mistral erweitert seinen Fokus über die Standard-Konversations-KI hinaus. Durch die Automatisierung der Umwandlung von PDFs in strukturierte KI-kompatible Formate entfernt es Engpässe in legalen, finanziellen und forschungsgesteuerten Branchen. Die KI-betriebene Dokumentverarbeitung war ein Bereich mit zunehmender Nachfrage, und die Fähigkeit, Text direkt in Markdown-Marke zu strukturieren, unterscheidet Mistral von Lösungen, die nur Rohtext ohne Organisation extrahieren. Funktionen wie die Echtzeit-Suche von Le Chat und das automatisierte Aufgabenverwaltung machen es zu einer vielseitigen Alternative zu OpenAIs ChatGPT Enterprise und Googles AI-betriebene Arbeitsbereichstools.

Categories: IT Info