Mistral AI a lancé son API OCR, un outil conçu pour convertir des documents PDF complexes en marquage structuré, rationalisant l’intégration avec les flux de travail de l’IA.
La version améliore l’automatisation pour les développeurs et les entreprises traitant des processus de document,
OCR
Selon les repères partagés par Mistral, son modèle OCR a démontré la précision globale la plus élevée parmi les principaux modèles OCR dans les tests de référence, dépassant les concurrents tels que Google Document AI, Azure OCR, Gemini-1.5-Flash-002 et GPT-4O d’OpenAI à travers plusieurs catégories de performances. src=”https://winbuzzer.com/wp-content/uploads/2024/07/mistral-ai-home-own.jpg”>
Il mène en reconnaissance mathématique avec une précision de 94,29, Overperforming Gemini-1.5-Flash-002, qui suit à 89.11. Dans le support multilingue, Mistral OCR 2503 scores 89,55, se classant au-dessus de l’OCR Azure à 87,52 et GPT-4O à 86,00.
Le modèle domine également la précision de document numérisée, atteignant 98,96, bien avant GEMINI-1.5-Pro-002. En ce qui concerne l’extraction du tableau, Mistral OCR atteint 96,12, dépassant considérablement le GPT-4O à 91,70 et Gemini-2.0-Flash-001 à 91,46. Avec une précision globale de 94,89, il mène tous les autres modèles, dépassant son plus proche concurrent, Gemini-1.5-Flash-002, qui a marqué 90,23.
Dans sa catégorie, excellant dans la gestion des structures de documents complexes, du contenu mathématique, du texte multilingue et de l’extraction de données structurées. Il établit une nouvelle norme pour les performances OCR alimentées par AI, offrant une précision plus élevée et une conversion de texte plus fiable par rapport à d’autres modèles dans le domaine.
Acosoordonnant à l’entreprise, «étant un poids plus léger que la plupart des modèles de la catégorie, Mistral OCR fonctionne considérablement plus rapidement que ses pairs, en traitement jusqu’à 2000 pages par minute sur un seul nœud. La capacité de traiter rapidement les documents assure l’apprentissage et l’amélioration continus même pour les environnements à haut débit.”
Au-delà de l’OCR traditionnel: Markdown
Contrairement aux outils OCR standard, qui extrait le texte non formaté, l’API de Mistral structure directement le contenu de la marque. href=”https://mistral.ai/fr/news/mistral-ocr”> Annonce Souligne que l’API interprète avec précision les tables, les formules et les éléments de documents complexes, ce qui le rend adapté à l’automatisation du document AI. Suit l’évolution de sa plate-forme LE Chat, qui a reçu des mises à jour majeures en novembre 2024. Celles-ci comprenaient l’intégration de la recherche Web en temps réel et l’édition de documents collaboratifs via Canvas, le positionnant comme un concurrent de Suites de productivité dirigée par AI. Route vers le traitement avancé des documents
La poussée de Mistral dans le document AI a été pavée par ses travaux sur Pixtral 12b, un modèle multimodal publié en septembre 2024. Il a été suivi par Pixtral grand en novembre, un modèle de document de 124 milliards de paramètres a été construit pour l’analyse des documents à haut contexte. Ces modèles définissent les bases de l’interprétation des données structurées, désormais exploitée dans la nouvelle API OCR.
Avant de faire avancer ses capacités d’OCR, Mistral avait déjà déplacé la concentration vers des modèles plus petits et plus efficaces pour le traitement local d’IA. En octobre 2024, il a introduit Ministral 3B et Ministral 8B, optimisé pour les applications d’IA hors ligne soucieuses de la vie privée. Ces modèles ont gagné du terrain dans les industries nécessitant une inférence sur les appareils, telles que les institutions financières et les prestataires de soins de santé gantant des données sensibles.
Étendant cette orientation, Mistral a lancé Mistral Small 3 en janvier, un LLM open-source conçu pour rivaliser avec le GPT-4O d’Openai. La société a indiqué qu’elle avait obtenu «plus de 81% sur la référence MMLU», démontrant une forte précision avec des exigences de calcul plus faibles. Contrairement aux modèles plus importants dépendants du nuage, les petits 3 peuvent fonctionner efficacement sur le matériel des consommateurs, renforçant l’accent mis par Mistral sur les offres accessibles AI. Les outils d’IA axés sur l’entreprise incluent également des solutions de modération de contenu, lancées en novembre 2024. Construit sur le modèle Ministral 8B, l’API de modération Mistral Content prend en charge la modération multilingue sur les onze langues, le filtrage du contenu nuisible tel que la parole de haine et l’exposition aux données personnelles. La société a élargi les capacités d’automatisation de Le Chat avec les agents de l’IA, rationalisant des flux de travail professionnels grâce à un résumé automatique des e-mails, à la rédaction du rapport et à l’analyse des documents.
En janvier, le PDG Arthur Mensch a confirmé au Forum économique mondial que Mitstral AI prépare un IPO, renforçant ses plans de croissance à long terme. Dans une interview avec Bloomberg, il a déclaré: «Nous ne sommes pas à vendre». La société a depuis étendu les opérations en Asie-Pacifique, ouvrant un bureau régional à Singapour pour établir une implanture dans les marchés de l’IA croissants.
Croissance des investissements et partenariats stratégiques 113 millions de dollars de semences ont été l’un des plus importants de l’histoire européenne de l’IA et au début de 2025, le financement total avait dépassé 1,1 milliard de dollars.
Soutenu par des entreprises telles que Andreessen Horowitz, les catalyseurs généraux et les partenaires de viande légers, la société s’est positionnée comme un compétiteur clé dans l’espace générateur de l’AI tout en conservant l’indépendance de l’indépendance de l’acquisition potentielle. a renforcé son attrait d’entreprise grâce à des partenariats stratégiques. De plus, ses partenariats avec qualcomm et sap ont soutenu le déploiement sur le matériel spécialisé et assuré de se conformer aux réglementations stratégiques de la confidentialité des données européennes
Alors qu’Openai, Google et Meta continuent de monter des modèles de plus en plus grands, Mistral a adopté une approche différente. Au lieu de hiérarchiser le nombre maximal de paramètres, la société s’est concentrée sur la rendez-vous des modèles efficaces, localement déployables et adaptables pour les environnements cloud et hors ligne.
Cette stratégie a été particulièrement évidente avec le succès de Ministral 3B, Ministral 8B et Mistral Small 3, offrant des alternatives qui nécessitent moins de ressources informatiques tout en conservant une grande précision.
Les modèles de Mistral ont été conçus pour les flux de travail structurés, les flux de travail générés par AI-Généré. Lancement de l’API, Mistral étend son objectif au-delà de l’IA conversationnelle standard. En automatisant la conversion des PDF en formats compatibles AI structurés, il supprime les goulots d’étranglement dans les industries juridiques, financières et axées sur la recherche. Le traitement des documents alimentés par l’IA a été un domaine de la demande croissante, et la capacité de structurer directement le texte dans Markdown distingue Mistral des solutions qui ne font que l’extraction de texte brut sans organisation.
Cette version est également liée à la stratégie plus large d’assistant AI de Mistral. Des fonctionnalités telles que la recherche en temps réel de Le Chat et la gestion des tâches automatisées en font une alternative polyvalente à ChatGPT Enterprise d’Openai et aux outils d’espace de travail alimenté par Google.