Microsoft on ottanut käyttöön kolmen uuden tekoälyn malleja PHI-bannerissaan, mikä on keskittynyt pienempiin, tehokkaisiin järjestelmiin, jotka kykenevät monimutkaiseen ongelmanratkaisuun. Yhtiö julkaistu Phi-4-Reasoning ja Phi-4-Reasoning-Plus-4-MACINI, joka sisältää 14 BILLION-parametria 3,8 miljardia parametriä. Niitä on nyt saatavana Microsoftin Azure Ai Fundryface.Co> ja kasvojen halaus Microsoftin Tekniset asiakirjat väittää, että PHI-4-Reasoning-Plus, joka on parannettu vahvistusoppimisen avulla, on kilpailukykyisesti Openaiin O3-Mini ja lähestyy Syvän matematiikan kykyä (671 Arvioinnit, kuten Aime 2025-testi.
Molemmat 14b-mallit ovat ilmoitettu Outperform Anthropicin Claude 3.7 Sonet ja Google’s Fromini Vertailuarvot, vaikka GPQA-tiedekysymyksiin ja BA-kalenterisuunnittelutehtäviin havaittiin poikkeuksia. Tekninen raportti korostaa merkittäviä hyötyjä myös PHI-4: n perusosassa yleisillä vertailuarvoilla. PHI-4-Reasoning-plus osoittaa 22 pisteen parannuksen IFEVAL: sta (ohjeet seuraavat) ja 10-pisteisen voiton Arenahardissa (ihmisen mieltymysten arviointi). Deepseek-R1-Distill-LLAMA-70B voi vaihdella 30%: sta 70%: iin 50 juoksun välillä, mikä tekee yhden juoksun vertailusta mahdollisesti epäluotettavan.
phi-4-mini-rangaistus, huolimatta sen 3.8b-parametrien koosta huolimatta useista Math-vertailumerkeistä ja tuista. href=”https://huggingface.co/microsoft/phi-4-mini-seasoning”Target=”_ tyhjä”> 128 000-Toiss Context Pituus 200K+ sanastokoko. Microsoft totesi nämä mallit “tasapainon koko ja suorituskyky”, mikä mahdollisti”jopa resurssien rajoitetut laitteet suorittamaan monimutkaisia päättelytehtäviä tehokkaasti.”PHI-4-Reasoning on alkuperäisen PHI-4-perusmallin valvottu hienosäätö (SFT), jossa käytetään yli 1,4 miljoonaa esimerkkiä Openain O3-minin tuottamien perustusvaiheiden kanssa. Suhteellinen politiikan optimointi (GRPO)-algoritmi, joka on suunniteltu parantamaan mallilähtöjä, jotka perustuvat suhteellisiin mieltymyksiin erilaisten tuotettujen vasteiden välillä-sen tulostuksen parantamiseksi.
Tämä johtaa matematiikan suurempaan tarkkuuteen, mutta tuottaa myös vastauksia, jotka ovat keskimäärin 1,5 kertaa pidempiä kuin PHI-4-rangaistus, ero vähemmän koodauksessa tai suunnittelussa. PHI-4-Mini-Reasoning-malli koulutettiin erikseen helmikuussa 2024 Miljoonan synteettisen matematiikan ongelman
Yksityiskohtaisten päättelyketjujen mukauttamiseksi 14B-mallien kontekstikapasiteetti kaksinkertaistui alkuperäisestä PHI-4: n 16K: sta 32K: n rahakkeista. Microsoft ehdottaa myös tiettyjä päätelmäasetuksia (kuten lämpötila 0.8) optimaalisille tuloksille Phi-4-Reasoning-plus-malli .
PHI-perheen ja strategisen kontekstin evoluutio
H3>
Käynnistys merkitsee Microsoftin PHI-projektin jatkamista, joka aloitti huomion alkuperäisen 14B-parametrin PHI-4: n kanssa joulukuussa 2024. Tämä alkuperäinen PHI 4-malli havaittiin vahvan matematiikan suorituskyvyn saavuttamiseksi, saavuttaen 91,8-pistemäärän AMC 12-testeissä, ennen kuin Gemini Pro 1.5 (89,8). Microsoft seurasi täysin avoimen lähdöksen PHI-4 tammikuussa 2025 vapauttamalla painonsa halaamalla kasvot MIT-lisenssin alla.
Tuolloin Microsoft Engineer Shital Shah lähetetty X: “Monet ihmiset olivat pyytäneet meiltä painon julkaisua… harvat tasaiset lähetetyt Bootlegged Phi-4-painot halausface <0xf0> <0x9f> <0x91: llä. No, odota enää. Perhe näki lisää laajentumista helmikuussa 2025 lisäämällä erilainen tekstipohjainen minimalli ja PHI-4-multimodaalinen variantti. Nykyiset päättelymallit rakennetaan suoraan aiemmin käytetyille SFT-ja synteettisille datatekniikoille.
Mallit korostavat Microsoftin strategiaa viljellä erittäin kykeneviä pienempiä malleja-usein nimeltään pieniä kielimalleja (SLMS)-sen investointien rinnalla laaja-alaiseen AI: hen, kuten Openain GPT-sarjaan. SLM: t saavat alan kiinnostusta mahdollisista eduista, kuten alennetuista koulutuskustannuksista ja helpommista aluekohtaisista hienosäätöistä. Tämä lähestymistapa kohdistuu tehokkuuteen ja saavutettavuuteen, mikä mahdollisesti vähentää esteitä yrityksille ja kehittäjille. Microsoft integroi PHI-mallit ekosysteemiinsä, kuten PHI-piidioksidivariantin, joka on optimoitu NPUS: lle Copilot+ PCS: ssä.
Laajemmalle pääsylle Phi-4-Mini-Reasoning on saatavana myös , suosittu muoto malleille paikallisesti kuluttajalaitteistoissa. Microsoft korosti, että PHI-mallit on kehitetty sen jälkeen, kun Vastuullinen AI-periaatteet , vaikka se kuittaa rajoitukset, kuten 32K: n token-konteksti 14B-mallille ja ensisijainen keskittyminen englanniksi.