Microsoft telah memperkenalkan trio model kecerdasan buatan baru di bawah bendera Phi, menguatkan fokusnya pada sistem yang lebih kecil dan cekap yang mampu menyelesaikan masalah yang kompleks. Syarikat
Model-model, yang diterangkan oleh Microsoft sebagai sistem di mana”model penalaran dilatih untuk memanfaatkan skala kesimpulan untuk melaksanakan tugas-tugas yang kompleks yang menuntut penguraian pelbagai langkah dan refleksi dalaman,”bertujuan untuk menyediakan prestasi yang lebih tinggi kepada sistem yang lebih besar. Mereka boleh didapati sekarang melalui Microsoft sasaran=”_ blank”> memeluk platform muka di bawah lesen permisif. Microsoft’s Dokumentasi teknikal Menegaskan bahawa phi-4-reasoning-plus, dipertingkatkan melalui pembelajaran optimum1) Penilaian matematik seperti ujian AIME 2025. Menolak sempadan penalaran dengan parameter yang lebih sedikit
Kedua-dua model 14B dilaporkan 128,000-token context length Dengan saiz perbendaharaan kata 200k+. Microsoft menyatakan model-model ini”saiz keseimbangan dan prestasi,”yang membolehkan”peranti terhad sumber untuk melaksanakan tugas-tugas penalaran yang kompleks dengan cekap.”
Di dalam proses latihan dan spesifikasi model
Mencapai prestasi ini melibatkan strategi latihan khusus. PHI-4-Reasoning adalah penalaan halus (SFT) yang diselia dari model asas PHI-4 yang asal, menggunakan lebih daripada 1.4 juta contoh dengan langkah-langkah penalaran yang dihasilkan oleh OpenAI’s O3-Mini. Pengoptimuman Dasar (GRPO)-algoritma yang direka untuk meningkatkan output model berdasarkan keutamaan relatif antara tindak balas yang dihasilkan-untuk memperbaiki outputnya.
Model phi-4-mini-reasoning dilatih secara berasingan pada bulan Februari 2024 pada
Pada masa itu, Microsoft Engineer Shah Shah diposkan di X,”Banyak orang telah meminta kami untuk melepaskan berat… Nah, tunggu lagi. Keluarga itu menyaksikan pengembangan selanjutnya pada bulan Februari 2025 dengan penambahan model mini berasaskan teks yang berbeza dan varian Phi-4-multimodal. Model penalaran semasa membina secara langsung pada teknik data SFT dan sintetik yang digunakan sebelum ini.
Model-model ini menggariskan strategi Microsoft untuk memupuk model yang lebih kecil yang berkebolehan-sering disebut model bahasa kecil (SLMS)-bersama-sama di samping pelaburannya dalam siri GPT OpenAI yang besar. SLMS mendapat faedah industri kerana potensi kelebihan seperti kos latihan yang dikurangkan dan lebih mudah penalaan domain khusus. Pendekatan ini mensasarkan kecekapan dan kebolehaksesan, berpotensi menurunkan halangan bagi perusahaan dan pemaju. Microsoft mengintegrasikan model PHI ke dalam ekosistemnya, seperti varian silika phi yang dioptimumkan untuk npus dalam copilot+ pcs.
Melalui projek-projek seperti Unsloth , format popular untuk menjalankan model tempatan pada perkakasan pengguna. Microsoft menekankan bahawa model phi dibangunkan berikutan prinsip ai yang bertanggungjawab