Kestabilan AI, dengan kerjasama Chip Designer Arm, yang diumumkan pada 14 Mei 2025, pelepasan sumber terbuka audio yang stabil kecil, model kecerdasan buatan teks-ke-audio yang padat dan cekap. Model AI stereo ini dioptimumkan secara khusus untuk dijalankan sepenuhnya pada CPU ARM, membolehkan keupayaan audio generatif secara langsung pada peranti seperti telefon pintar tanpa bergantung pada pemprosesan awan. Pelepasan ini penting kerana ia bertujuan untuk mendemokrasikan penciptaan audio untuk pelbagai pengguna dan aplikasi yang lebih luas, sementara menangani kebimbangan harta intelektual dengan dilatih secara eksklusif pada audio bebas royalti. href=”https://stability.ai/news/stability-ai-and-arm-release-stable-audio-open-small-enabling-real-deployment-for-on-device-udio-control”_ blank”Prestasi ini dibina pada Prem Akkaraju, Ketua Pegawai Eksekutif Kestabilan AI, menyerlahkan pencapaian terdahulu ini, menyatakan”Terima kasih kepada pengoptimuman model dan lengan Kleidiai, kami berpindah dari beberapa minit ke beberapa saat untuk menjana audio sepenuhnya pada CPU ARM pada telefon pintar.”Audio yang stabil semasa terbuka kecil memanfaatkan kemajuan ini, menjadikannya mudah diakses tanpa keperluan perkakasan berat, kerana kestabilan nota berita AI. permisif Lesen komuniti kestabilan github , dan kertas penyelidikannya diterbitkan pada Pemprosesan Audio Open Op Open Audio Small menawarkan fungsi kelajuan dan luar talian, pembezaan utama dari banyak perkhidmatan generasi audio yang bergantung kepada awan. Walaupun direka terutamanya untuk sampel audio pendek seperti kesan bunyi atau riff muzik, kestabilan AI mengakui batasan tertentu. Model ini hanya menyokong hanya ingat bahasa Inggeris dan belum dioptimumkan untuk menghasilkan vokal yang sangat realistik atau lagu-lagu penuh yang kompleks. Istilah pelesenan disusun untuk menggalakkan penggunaan yang luas: ia percuma untuk penyelidik, penggemar, dan perniagaan yang berpendapatan kurang dari $ 1 juta setahun. Walau bagaimanapun, entiti yang lebih besar melebihi pendapatan ini memerlukan lesen enterprise dari kestabilan ai. Sumber adalah langkah strategik dalam industri yang semakin tertumpu kepada hak harta intelek. Ini berbeza dengan alat audio AI yang lain, yang sebahagiannya telah menghadapi tindakan undang-undang dari label rekod kerana didakwa menggunakan muzik berhak cipta tanpa kebenaran yang betul. Dengan menggunakan data berlesen secara terbuka, kestabilan AI bertujuan untuk menyediakan asas yang lebih sah untuk pencipta. Nvidia juga membentangkan model audio Fugatto yang maju pada bulan November 2024, walaupun ia belum dikeluarkan secara terbuka kerana kebimbangan mengenai potensi penyalahgunaan, mencerminkan pendekatan berhati-hati terhadap teknologi generatif yang kuat. Baru-baru ini, Google memperkenalkan model AI teks-ke-musik Lyria pada bulan April, terutamanya untuk pelanggan perusahaannya, walaupun, seperti yang dinyatakan oleh Winbuzzer, butiran mengenai dataset latihannya tidak ditentukan pada evolusi audio yang stabil di atas domain, berikutan pelancaran awal platform audio yang stabil pada September 2023. sasaran=”_ blank”> audiosparx , memberi tumpuan kepada generasi berasaskan awan. Versi”kecil”baru ini, bagaimanapun, dengan jelas memprioritaskan kecekapan dan penempatan pada peranti, sejajar dengan trend industri ke arah EDGE AI. Syarikat itu telah mengalami penstrukturan semula kewangan dan perubahan kepimpinan, setelah menaikkan wang tunai baru tahun lepas. Gabungan aksesibiliti, prestasi di peranti, dan asas data bebas royalti boleh membuat audio yang stabil membuka pilihan kecil yang menarik untuk pemaju dan pencipta.