Microsoft ka Phi-4 me burim të hapur, modelin e tij kompakt të gjuhës, për publikun duke lëshuar peshën e tij të plotë në Hugging Face nën një licencë MIT.
Phi-4, i prezantuar për herë të parë në dhjetor 2024 përmes licencës së MIT. Platforma Azure AI Foundry e Microsoft-it, fillimisht ishte e disponueshme vetëm për studiuesit nën një licencë të kontrolluar. Me lëshimin me burim të hapur, Microsoft u ofron studiuesve dhe zhvilluesve në mbarë botën mjetet për të personalizuar, vendosur dhe komercializuar modelin kompakt por me performancë të lartë.
Phi-4: Një model kompakt me përmasa të mëdha. Rezultatet
Phi-4 përfaqëson një largim nga zhvillimi tradicional i AI, i cili shpesh e ka prioritizuar shkallën si metrikën kryesore për performancën. Me vetëm 14 miliardë parametra, Phi-4 jep rezultate që rivalizojnë dhe madje i tejkalojnë homologët më të mëdhenj, si Gemini Pro 1.5 i Google dhe GPT-4o i OpenAI.
Burimi: Microsoft
Në standardet e fundit, Phi-4 shënoi një notë mbresëlënëse 91.8 në amerikanin Konkursi i Matematikës (AMC 12), duke tejkaluar rezultatin e Gemini Pro 1.5 prej 89.8 dhe GPT-4o’s 77.9.
Microsoft shfaqi aftësitë e arsyetimit matematikor të Phi-4 përmes një problemi të kombinatorikës, ku modeli llogariti me saktësi 431 permutacione të dallueshme për një garë hipotetike që përfshin pesë kërmij.
Phi-4 tejkalon modelet shumë më të mëdha, duke përfshirë Gemini Pro 1.5, në problemet e konkurrencës në matematikë (Burimi: Microsoft)
Ky nivel saktësie thekson potencialin e tij për domenet që kërkojnë rigorozitet logjik dhe matematikor, si financat, inxhinierinë dhe kërkimin shkencor.
Microsoft shpjegoi objektivat e tij për Phi-4 në dokumentacionin e tij zyrtar: “Phi-4 vazhdon të shtyjë kufirin. e madhësisë kundrejt cilësisë”, një mendim i bërë jehonë nga studiuesit të cilët e kanë krahasuar performancën e tij me modelet me pesëfishin e numrit të parametrave.
Themeli i suksesit të Phi-4 qëndron në qasjen e tij të trajnimit të Microsoft-it të përdorura në grupe të dhënash sintetike që përfshijnë përmbajtje të stilit të teksteve, duke theksuar arsyetimin matematikor, programimin dhe. logjika e sensit të përbashkët. Këto grupe të dhënash, që arrijnë në 9.8 trilion argumente, u plotësuan nga dokumente publike të kuruara, tekste akademike dhe të dhëna shumëgjuhëshe.
“Në vend që të shërbejnë si një zëvendësues i lirë për të dhënat organike, të dhënat sintetike ofrojnë avantazhe të drejtpërdrejta,”vuri në dukje Microsoft. në raportin e tij teknik, duke theksuar kontrollin dhe përshtatshmërinë që ofron gjatë trajnimit të modelit mospërputhjet.
Për të përmirësuar arsyetimin dhe përafrimin e modelit, Microsoft aplikoi teknika të avancuara pas trajnimit, si rregullimi i mbikëqyrur dhe optimizimi i drejtpërdrejtë i preferencave-produkte cilësore, duke rritur më tej saktësinë e tij në aplikacionet specifike të domenit.
Open-Bource. Disponueshmëria
Vendimi për të lëshuar Phi-4 si me burim të hapur pasqyron strategjinë më të gjerë të Microsoft për të demokratizuar mjetet e AI. Zhvilluesit tani mund t’i qasen modelit në Fytyrë përqafuese, ku janë pesha e saj e plotë në dispozicion sipas një licence MIT. Shital Shah, një inxhinier kryesor në Microsoft, njoftoi lëshimin në X (ish Twitter), duke shkruar,”Shumë njerëz na kishin kërkuar lirimin e peshës… Epo, mos prisni më.”
Ne kemi qenë plotësisht të habitur nga përgjigja ndaj lëshimit të phi-4. Shumë njerëz na kishin kërkuar lirimin e peshës HuggingFace😬. Epo, mos prisni më.co/rcugWBPU4r”>pic.twitter.com/rcugWBPU4r
— Shital Shah (@sytelus) 8 janar 2025
Lëshimi me burim të hapur u mundëson zhvilluesve të personalizojnë Phi-4 për aplikacione specifike pa shpenzime llogaritëse të lidhura zakonisht me modele më të mëdha Arkitektura e dendur, vetëm me dekoder, një variant i modelit të transformatorit, minimizon kërkesat për burime, duke e bërë atë të aksesueshme edhe për organizatat me infrastrukturë të kufizuar.
Konsideratat etike dhe ndikimet në industri
Planizim i Phi-4 nga Microsoft thekson angazhimin e tij për vendosjen e përgjegjshme të AI. Platforma Azure AI Foundry, e cila fillimisht priti Phi-4, përfshin masa mbrojtëse si filtrimi i përmbajtjes dhe testimi kundërshtar. Këto masa janë krijuar për të zbutur rreziqet si paragjykimet, dezinformatat dhe gjenerimi i përmbajtjes së dëmshme.
Duke lëshuar Phi-4 nën një licencë me burim të hapur, Microsoft trajton gjithashtu kërkesën në rritje për transparencë në zhvillimin e AI. Lëvizja përputhet me tendencat e industrisë që shihen në publikimet si Llama 3.2 e Meta dhe seritë Gemma të Google, megjithëse performanca e spikatur e Phi-4 në standardet vendos një standard të ri për modelet kompakte.
Phi-4 sfidon supozimin se modelet më të mëdha janë në thelb më të mira. Dizajni i tij kompakt jo vetëm që redukton kostot llogaritëse dhe të energjisë, por gjithashtu zgjeron aksesin në aftësitë e avancuara të AI. Ky efikasitet është veçanërisht i vlefshëm për organizatat dhe studiuesit e mesëm të cilëve u mungojnë burimet për të vendosur modele masive.
Ndërsa AI vazhdon të evoluojë, Phi-4 ofron një paraqitje të shkurtër në një të ardhme ku mund të takohen modelet më të vogla dhe më të zgjuara. kërkesat e detyrave të specializuara pa kompromentuar performancën.