Microsoft telah membuka sumber terbuka Phi-4, model bahasa padatnya, kepada orang ramai dengan melepaskan berat penuhnya pada Wajah Memeluk di bawah Lesen MIT.
Phi-4, mula diperkenalkan pada Disember 2024 hingga Platform Azure AI Foundry Microsoft, pada mulanya hanya tersedia untuk penyelidik di bawah lesen terkawal. Dengan keluaran sumber terbuka, Microsoft membekalkan penyelidik dan pembangun di seluruh dunia dengan alatan untuk menyesuaikan, menggunakan dan mengkomersialkan model yang padat tetapi berprestasi tinggi.
Phi-4: Model Kompak dengan Outsized Keputusan
Phi-4 mewakili perlepasan daripada pembangunan AI tradisional, yang sering mengutamakan skala sebagai metrik utama untuk prestasi. Dengan hanya 14 bilion parameter, Phi-4 memberikan hasil yang menyaingi malah mengatasi rakan sejawat yang lebih besar, seperti Gemini Pro 1.5 Google dan GPT-4o OpenAI.
Sumber: Microsoft
Dalam penanda aras baru-baru ini, Phi-4 menjaringkan 91.8 yang mengagumkan pada Pertandingan Matematik Amerika (AMC 12), mengatasi markah Gemini Pro 1.5 iaitu 89.8 dan GPT-4o 77.9.
Microsoft mempamerkan keupayaan penaakulan matematik Phi-4 melalui masalah kombinatorik, di mana model itu mengira dengan tepat 431 pilih atur berbeza untuk perlumbaan hipotesis yang melibatkan lima siput.
Phi-4 mengatasi model yang lebih besar, termasuk Gemini Pro 1.5, dalam masalah persaingan matematik (Sumber: Microsoft)
Tahap ketepatan ini menyerlahkan potensinya untuk domain memerlukan ketelitian logik dan matematik, seperti kewangan, kejuruteraan dan penyelidikan saintifik.
Microsoft menjelaskan objektifnya untuk Phi-4 dalam dokumentasi rasminya: “Phi-4 terus menolak sempadan saiz berbanding kualiti,”sentimen yang digemakan oleh penyelidik yang telah membandingkan prestasinya dengan model dengan lima kali ganda bilangan parameter.
Metodologi Latihan dan Data Sintetik
Asas kejayaan Phi-4 terletak pada pendekatan latihannya Microsoft memanfaatkan set data sintetik yang terdiri daripada kandungan gaya buku teks, menekankan penaakulan matematik, pengaturcaraan dan logik akal. Set data ini, berjumlah 9.8 trilion token, telah ditambah dengan dokumen awam yang dipilih susun, teks akademik dan data berbilang bahasa.
“Daripada berfungsi sebagai pengganti murah untuk data organik, data sintetik menawarkan kelebihan langsung,”kata Microsoft dalam laporan teknikalnya, menonjolkan kawalan dan kebolehsuaian yang diberikannya semasa latihan model Pendekatan ini juga mengurangkan pergantungan pada kandungan yang dikikis web, sering dikritik kerana kualiti ketidakkonsistenan.
Untuk mempertingkatkan penaakulan dan penjajaran model, Microsoft menggunakan teknik pasca latihan lanjutan seperti penyeliaan penalaan halus dan pengoptimuman keutamaan langsung Metodologi ini memperhalusi keupayaan Phi-4 untuk membezakan antara berkualiti tinggi dan rendah-output berkualiti, meningkatkan lagi ketepatannya dalam aplikasi khusus domain.
Sumber Terbuka Ketersediaan
Keputusan untuk mengeluarkan Phi-4 sebagai sumber terbuka mencerminkan strategi Microsoft yang lebih luas untuk mendemokrasikan alatan AI kini boleh mengakses model pada Memeluk Muka, di mana berat penuhnya tersedia di bawah Lesen MIT. Shital Shah, seorang jurutera utama di Microsoft, mengumumkan keluaran di X (dahulunya Twitter), menulis,”Ramai orang telah meminta kami untuk melepaskan berat badan… Baiklah, jangan tunggu lagi.”
Kami benar-benar kagum dengan maklum balas kepada keluaran phi-4 Ramai orang telah meminta kami untuk mengeluarkan berat badan walaupun hanya sedikit yang memuat naik bobot phi-4 HuggingFace😬.
Nah, jangan tunggu lagi hari ini kami mengeluarkan model phi-4 rasmi di HuggingFace!
Dengan lesen MIT!!.co/rcugWBPU4r”>pic.twitter.com/rcugWBPU4r
— Shital Shah (@sytelus) 8 Januari 2025
Keluaran sumber terbuka membolehkan pembangun menyesuaikan Phi-4 untuk aplikasi khusus tanpa overhed pengiraan yang biasanya dikaitkan dengan model yang lebih besar. seni bina penyahkod sahaja, varian model pengubah, meminimumkan keperluan sumber, menjadikannya boleh diakses walaupun kepada organisasi yang mempunyai infrastruktur terhad.
Pertimbangan Etika dan Kesan Industri
Pelancaran Phi-4 oleh Microsoft menyerlahkan komitmennya terhadap penggunaan AI yang bertanggungjawab. Platform Azure AI Foundry, yang pada mulanya menjadi tuan rumah Phi-4, menggabungkan perlindungan seperti penapisan kandungan dan ujian lawan. Langkah-langkah ini direka bentuk untuk mengurangkan risiko seperti berat sebelah, maklumat salah dan penjanaan kandungan yang berbahaya.
Dengan mengeluarkan Phi-4 di bawah lesen sumber terbuka, Microsoft turut menangani permintaan yang semakin meningkat untuk ketelusan dalam pembangunan AI. Langkah ini sejajar dengan aliran industri yang dilihat dalam keluaran seperti Meta Llama 3.2 dan siri Gemma Google, walaupun prestasi menonjol Phi-4 dalam penanda aras menetapkan standard baharu untuk model kompak.
Phi-4 mencabar andaian bahawa model yang lebih besar sememangnya lebih baik. Reka bentuknya yang padat bukan sahaja mengurangkan kos pengiraan dan tenaga tetapi juga meluaskan akses kepada keupayaan AI lanjutan. Kecekapan ini amat berharga untuk organisasi bersaiz sederhana dan penyelidik yang kekurangan sumber untuk menggunakan model besar-besaran.
Ketika AI terus berkembang, Phi-4 menawarkan gambaran masa depan di mana model yang lebih kecil dan lebih pintar boleh bertemu tuntutan tugas khusus tanpa menjejaskan prestasi.