Mistral AI telah meluncurkan OCR API-nya, sebuah alat yang dirancang untuk mengubah dokumen PDF yang kompleks menjadi penurunan harga terstruktur, merampingkan integrasi dengan alur kerja AI.
Rilis ini meningkatkan otomatisasi untuk pengembang dan bisnis yang berurusan dengan proses yang berat,
Menurut tolok ukur yang dibagikan oleh Mistral, model OCR itu telah menunjukkan keakuratan keseluruhan tertinggi di antara model OCR terkemuka dalam tes benchmark, melampaui pesaing seperti GEOPE DOKUMEN AI, AZURE OCR, GEMINI-PERINGKAT/PRANKING
Ini memimpin dalam pengakuan matematika dengan akurasi 94.29, mengungguli Gemini-.5-flash-002, yang merupakan berikut. Dalam dukungan multibahasa, skor Mistral OCR 2503 89,55, peringkat di atas Azure OCR di 87,52 dan GPT-4O pada 86,00.
Model ini juga mendominasi akurasi dokumen yang dipindai, mencapai 98,96, di depan Gemini-1.5-Pro-002 di 96.15 dan GEM dan GEMIN-2.0.0.0. Ketika datang ke ekstraksi meja, Mistral OCR mencapai 96.12, secara signifikan melebihi GPT-4O di 91.70 dan Gemini-2.0-Flash-001 di 91.46. Dengan akurasi keseluruhan 94,89, ini memimpin semua model lain, melampaui pesaing terdekatnya, Gemini-1.5-Flash-002, yang mencetak 90,23.
Hasil ini mengindikasikan bahwa mistral, ocral, ocral ocral, ocral ocral. Struktur, konten matematika, teks multibahasa, dan ekstraksi data terstruktur. Ini menetapkan standar baru untuk kinerja OCR bertenaga AI, menawarkan akurasi yang lebih tinggi dan konversi teks yang lebih andal dibandingkan dengan model lain di lapangan. Acoording ke perusahaan, “Menjadi bobot yang lebih ringan daripada sebagian besar model dalam kategori, Mistral OCR berkinerja lebih cepat secara signifikan daripada rekan-rekannya, memproses hingga 2000 halaman per menit pada node tunggal. Kemampuan untuk memproses dokumen dengan cepat memastikan pembelajaran dan peningkatan yang berkelanjutan bahkan untuk lingkungan throughput tinggi.” Tidak seperti alat OCR standar, yang mengekstrak teks yang tidak diformat, API Mistral secara langsung menyusun konten dalam penandaan perusahaan. href=”https://mistral.ai/fr/news/mistral-ocr”> pengumuman Menyoroti bahwa API secara akurat menginterpretasikan tabel, rumus, dan elemen dokumen yang kompleks, menjadikannya yang dikemukakan oleh panci. Pemrosesan mengikuti evolusi platform LE Chat-nya, yang menerima pembaruan besar pada bulan November 2024. Ini termasuk integrasi pencarian web real-time dan pengeditan dokumen kolaboratif melalui kanvas, memposisikannya sebagai pesaing untuk suite produktivitas yang digerakkan oleh AI. Kreasi kreatif. Models and the Road to Advanced Document Processing
Mistral’s push into document AI was paved by its work on Pixtral 12B, a multimodal model released in September 2024. It was followed by Pixtral Large in November, a 124-billion-parameter model built for high-context document analysis, with expanded OCR capabilities that supported large-scale parsing. Model-model ini menetapkan dasar untuk interpretasi data terstruktur, yang sekarang dimanfaatkan dalam OCR API baru. Sebelum memajukan kemampuan OCR-nya, Mistral telah mengalihkan fokus ke model yang lebih kecil dan lebih efisien untuk pemrosesan AI lokal. Pada Oktober 2024, ia memperkenalkan Ministral 3B dan Ministral 8B, dioptimalkan untuk aplikasi AI offline yang sadar privasi. Model-model ini mendapatkan daya tarik dalam industri yang membutuhkan inferensi di perangkat, seperti lembaga keuangan dan penyedia layanan kesehatan yang menangani data sensitif. Memperluas fokus ini, Mistral meluncurkan Mistral Small 3 pada bulan Januari, sebuah sumber terbuka yang dirancang untuk menyaingi Openai GPT-4O Mini. Perusahaan melaporkan bahwa ia mencapai”lebih dari 81% pada tolok ukur MMLU,”menunjukkan keakuratan yang kuat dengan persyaratan komputasi yang lebih rendah. Tidak seperti model yang lebih bergantung pada awan, 3 kecil dapat berjalan secara efisien pada perangkat keras konsumen, memperkuat penekanan MISTRAL dengan penekanan MISTRAL dengan MUSTRAL AI. Alat AI yang berfokus pada perusahaan juga mencakup solusi moderasi konten, yang diluncurkan pada November 2024. Dibangun di atas model Ministral 8B, API moderasi konten mistral mendukung moderasi multibahasa di sebelas bahasa, memfilter konten berbahaya seperti pidato kebencian dan paparan data yang sama. Kemampuan otomatisasi Le Chat yang diperluas dengan agen AI, merampingkan alur kerja profesional melalui peringkasan email otomatis, perancangan laporan, dan analisis dokumen. Pada bulan Januari, CEO Arthur Mensch dikonfirmasi di Forum Ekonomi Dunia bahwa AI Mistral sedang mempersiapkan IPO, memperkuat rencana pertumbuhan jangka panjangnya. Dalam sebuah wawancara dengan Bloomberg, ia menyatakan, “Kami tidak dijual.”Perusahaan ini telah memperluas operasi ke Asia-Pasifik, membuka kantor regional di Singapura untuk mendirikan pijakan di pasar AI yang sedang tumbuh. Sejak ditemukannya 202. Putaran benih awal $ 113 juta adalah salah satu yang terbesar dalam sejarah AI Eropa, dan pada awal 2025, total dana telah melebihi $ 1,1 miliar. Mistral juga telah memperkuat daya tarik perusahaannya melalui kemitraan strategis. Selain itu, kemitraannya dengan Qualcomm dan SAP telah mendukung pemasangan/kompetisi yang kuat, dan memaksakan pompateran dengan peraturan privasi data. Sementara Openai, Google, dan Meta terus meningkatkan model yang semakin besar, Mistral telah mengambil pendekatan yang berbeda. Alih-alih memprioritaskan jumlah parameter maksimum, perusahaan telah berfokus pada membuat model efisien, dapat digunakan secara lokal, dan dapat disesuaikan untuk lingkungan cloud dan offline. This strategy has been particularly evident with the success of Ministral 3B, Ministral 8B, and Mistral Small 3, offering alternatives that require fewer computational resources while maintaining high accuracy. Mistral’s models have been designed for structured content workflows, offering AI-generated Markdown formatting, real-time collaboration tools, and integrations with business automation platforms. With the OCR Peluncuran API, Mistral memperluas fokusnya di luar AI percakapan standar. Dengan mengotomatiskan konversi PDF menjadi format yang kompatibel dengan AI terstruktur, ia menghilangkan kemacetan dalam industri hukum, keuangan, dan yang digerakkan oleh penelitian. Pemrosesan dokumen bertenaga AI telah menjadi area yang meningkat permintaan, dan kemampuan untuk secara langsung menyusun teks menjadi penurunan harga yang tidak disukai dari solusi yang hanya mengekstrak teks mentah tanpa organisasi. Rilis ini juga terkait dengan strategi asisten AI Mistral yang lebih luas. Fitur-fitur seperti pencarian real-time Le Chat dan manajemen tugas otomatis menjadikannya alternatif yang serba guna untuk perusahaan chatgpt openai dan alat ruang kerja bertenaga AI Google. di luar OCR tradisional: Markdown siap-ai
pertumbuhan investasi dan kemitraan strategis