Mistral AIは、複雑なPDFドキュメントを構造化されたマークダウンに変換し、AIワークフローとの統合を合理化するために設計されたツールであるOCR APIを発売しました。
リリースは、ドキュメントが多いプロセスを扱う開発者とビジネスの自動化を強化し、マニュアル形式のニーズを排除する構造化出力を提供します。 OCR
Mistralが共有するベンチマークによると、OCRモデルは、GoogleドキュメントAI、Azure OCR、Gemini-1.5-Flash-002、OpenAIのGPT-4OにわたるOpenAIのGPT-4Oを超えるGPT-4oなどの競合他社を上回るベンチマークテストで、ベンチマークテストで主要なOCRモデルの間で最も高い精度を実証しています。 src=”https://winbuzzer.com/wp-content/uploads/2024/07/mistral-ai-home-own.jpg”>
94.29の精度で数学認識をリードし、ジェミニ1.5-フラッシュ-002を抑制します。多言語サポートでは、ミストラルOCR 2503スコア89.55で、87.52でAzure OCR、86.00でGPT-4Oを上回ります。テーブル抽出に関しては、ミストラルOCRは96.12に達し、91.70でGPT-4Oを大幅に超え、91.46でGemini-2.0-Flash-001を超えています。全体的な精度は94.89で、他のすべてのモデルをリードし、最も近い競合他社であるGemini-1.5-Flash-002を上回り、90.23を獲得しました。 94.65 89.52 GEMINI-1.5-FLASH-002 90.23 89.11 86.76 94.87 90.48 GEMINI-1.5-PRO-002 89.92 88.48 86.33 96.15 89.71 GEMINI-2.0-FLASH-88.69 84.18 85.16 GPT-4O-2024-11-20 89.77 87.55 86.00 94.58 91.70ミストラルOCR 2503 94.89 94.29 89.55 98.96
従来のOCRを超えて:ai-readyマークダウン
標準的なOCRツールとは異なります。 href=”https://mistral.ai/fr/news/mistral-ocr”>アナウンスは、APIがテーブル、フォーミュラ、および複雑な要素を正確にインターフェストし、AI駆動型の自動化にも適していることを強調しています。 2024年11月に主要な更新を受けたLEチャットプラットフォームの進化。これらには、キャンバスを介したリアルタイムのWeb検索統合と共同ドキュメント編集が含まれ、AI主導の生産性スイートの競合他社としての位置付け。高度なドキュメント処理への道
ミストラルのドキュメントAIへのプッシュは、2024年9月にリリースされたマルチモーダルモデルであるPixtral 12Bの作業によって舗装されました。これらのモデルは、新しいOCR APIでレバレッジされた構造化データ解釈の基礎を設定しました。
OCR機能を進める前に、ミストラルはすでにローカルAI処理のより小さく、より効率的なモデルに焦点をシフトしていました。 2024年10月に、プライバシーを意識したオフラインAIアプリケーション向けに最適化されたMinistral 3BおよびMinistral 8Bを導入しました。これらのモデルは、機密データを処理する金融機関やヘルスケアプロバイダーなど、デバイス上の推論を必要とする業界で牽引力を獲得しました。同社は、「MMLUベンチマークで81%以上」を達成し、計算要件が低いことで強力な精度を実証したと報告しました。より大きなクラウド依存モデルとは異なり、Small 3は消費者ハードウェアを効率的に実行し、Mistralのアクセス可能なAIソリューションを強化することができます。 AIツールには、2024年11月に発売されたコンテンツモデレーションも含まれています。ミニストラルコンテンツモデレーションは、11の言語で多言語モデレートをサポートし、ヘイトスピーチや個人データエクスポージャーなどの有害なコンテンツをフィルタリングし、大規模なプラットフォームを拡大するために拡大します。 AIエージェントを使用した機能、自動メールの要約を通じて専門的なワークフローを合理化する機能、レポートドラフト、ドキュメント分析。
1月、CEOのアーサーメンシュは、ミストラルAIがIPOの準備をしていることを世界経済フォーラムで確認し、長期成長計画を強化しました。ブルームバーグとのインタビューで、彼は「私たちは売りに出されていない」と述べました。同社はその後、アジア太平洋地域に事業を拡大し、シンガポールに地域事務所を開設してAI市場の成長に足場を確立しました。 1億1,300万ドルのシードラウンドはヨーロッパのAI史上最大の1つであり、2025年初頭までに、総資金は11億ドルを超えていました。 Microsoftとのコラボレーションにより、エンタープライズはモデルをazureに導き、AIをクラウドベースの運用に統合するためのアクセシビリティを高めました。さらに、そのパートナーシップは qualcomm および sap
Openai、Google、およびMetaがますます大きなモデルを拡大し続けている間、Mistralは別のアプローチを採用しています。最大パラメーターカウントに優先順位を付ける代わりに、同社は、クラウド環境とオフライン環境の両方に効率的で、ローカルに展開可能で、適応可能なモデルになることに焦点を当てています。
この戦略は、ミニストラル3B、ミニストラル8B、ミストラルスモール3の成功に特に明白であり、高い精度を維持しながら計算リソースを必要とする代替品を提供します。 OCR APIの発売、Mistralは標準的な会話型AIを超えて焦点を拡大しています。 PDFの構造化されたAI互換形式への変換を自動化することにより、法的、金融、および研究主導型の業界でボトルネックを削除します。 AIを搭載したドキュメント処理は需要の増加の分野であり、マークダウンにテキストを直接構築する能力は、組織なしで生のテキストのみを抽出するソリューションとは別にMistralを設定します。 Le Chatのリアルタイム検索や自動化されたタスク管理などの機能により、OpenaiのChatGPTエンタープライズやGoogleのAI搭載ワークスペースツールに代わる多目的な代替品になります。