Bahagian Penyelidikan AI Meta telah mengeluarkan Omnilingual ASR, sistem pengenalan ucapan sumber terbuka yang kuat yang menyokong lebih daripada 1,600 bahasa.
Projek ini bertujuan untuk mewujudkan alat transkripsi sejagat, menyediakan sokongan AI untuk 500 bahasa untuk kali pertama. Dibangunkan oleh Pasukan Penyelidikan AI (FAIR) asas Meta, model-model ini boleh didapati di bawah lesen permisif untuk penggunaan dan penggunaan komersial. Suite ini merangkumi pelbagai saiz model, dari versi ringan untuk peranti mudah alih ke model berskala besar untuk ketepatan maksimum.
Lompat kuantum dalam liputan bahasa
skala ASR omnilingual mewakili peristiwa penting untuk teknologi pertuturan. Sokongannya untuk lebih daripada 1,600 bahasa secara dramatik memperluaskan akses global, terutamanya jika dibandingkan dengan sistem proprietari terkemuka seperti Openai’s Whisper, yang meliputi sekitar 100 bahasa. Breadth, pasukan adil Meta bersepadu dataset yang tersedia secara terbuka dengan rakaman masyarakat yang dikumpulkan melalui perkongsian dengan organisasi seperti suara biasa Mozilla.
Usaha kolaborasi ini adalah penting untuk mencapai bahasa dengan jejak digital yang sedikit atau tidak ada. Dalam satu langkah untuk membakar inovasi selanjutnya, Meta juga melepaskan