Noul model Phi-4 Small AI de la Microsoft depășește rivalii mai mari în matematică

Noul model AI Phi-4 de la Microsoft provoacă credința de mult timp că mai mare este întotdeauna mai bun. Cu doar 14 miliarde de parametri, Phi-4 depășește în mod constant modelele mult mai mari, inclusiv Gemini Pro 1.5 de la Google, în sarcini care necesită raționament matematic.

Seria Phi de la Microsoft este o familie de modele de limbi mici (SLM) concepute pentru a oferi capabilități AI puternice într-un pachet mai compact și mai eficient.

Prin concentrarea pe eficiență și performanță vizată, modelul compact oferă rezultate excelente în timp ce consumând mult mai puține resurse de calcul, marcând o schimbare decisivă în abordarea industriei AI în ceea ce privește dezvoltarea modelelor.

Phi-4 reflectă un efort deliberat de a se rupe de cursa către creați sisteme AI din ce în ce mai masive. În timp ce concurenți precum GPT-4o se bazează pe sute de miliarde de parametri, performanța lui Phi-4 ilustrează puterea metodologiilor inovatoare de antrenament și concentrarea pe aplicațiile specializate.

Noul model este acum disponibil prin intermediul Microsoft Azure AI Foundry sub o licență de cercetare, cu planuri pentru o distribuție mai largă prin Hugging Face.

Sursa: Microsoft

Conform Microsoft, Phi-4 a obținut un scor mediu de 91,8, depășind toate celelalte modele AI evaluate în recenta competiție americană de matematică Teste AMC 12.

Aceste examene anuale sunt administrate pentru a evalua și îmbunătăți abilitățile de rezolvare a problemelor în rândul elevilor de liceu. AMC 10 este conceput pentru elevii din clasa a 10-a și mai jos, acoperind matematică până la programa de clasa a 10-a, în timp ce AMC 12 este destinat elevilor din clasa a XII-a și mai jos, cuprinzând întreaga programa de matematică de liceu, excluzând calculul.

În AMC 12, Phi-4 a depășit Google Gemini Pro 1.5 (89.8) ca model mare cu cel mai mare punctaj. Printre alte modele mai mici, Phi-4 a demonstrat o marjă semnificativă de superioritate.

Alte modele mici, cum ar fi Qwen 2.5 Instruct (77.4) și Claude 3.5 Sonnet (74.8), au rămas în urmă. Modelele mari precum GPT-4o (77.9) și Gemini Flash 1.5 (81.6) au obținut, de asemenea, scoruri mai mici decât Phi-4. Modelul cu cele mai slabe performanțe a fost Llama-3.3 70B Instruct, cu un scor de 66,4.

Sursa: Microsoft

Phi-4 Precizie în rezolvarea problemelor

Capacitățile lui Phi-4 sunt exemplificate într-o problemă de combinatorie împărtășită de Microsoft, în care modelul a calculat toate rezultatele posibile într-o cursă ipotetică între cinci melci. Problema, care permitea scenarii cu cel mult o egalitate, necesita o defalcare detaliată a permutărilor și raționament logic.

Phi-4 a determinat cu exactitate că au existat 431 de rezultate distincte, demonstrând capacitatea sa excepțională de a aborda provocări matematice complexe. O astfel de rezolvare precisă a problemelor face ca Phi-4 să fie deosebit de valoros pentru aplicații în domenii precum cercetarea științifică, inginerie și modelare financiară.

Sursa: Microsoft

Excelența modelului se extinde la benchmark-uri standardizate. La competițiile americane de matematică (AMC), Phi-4 a obținut 91,8, depășind Gemini Pro 1.5 de la Google, care a obținut 89,8.

Aceste rezultate evidențiază capacitatea sa de a efectua sarcini riguroase, din lumea reală, care necesită precizie logică. Microsoft atribuie acest succes integrării seturilor de date sintetice și tehnicilor post-training, care sporesc concentrarea și acuratețea modelului în domenii specifice.

Rolul datelor sintetice și post-formare

Un factor cheie din spatele succesului Phi-4 este dependența acestuia de date sintetice-seturi de date generate artificial, utilizate pentru a completa datele din lumea reală.

Datele sintetice permit modelului să se antreneze eficient pe o gamă mai largă de scenarii, îmbunătățindu-și adaptabilitatea și performanța. Microsoft a aplicat, de asemenea, tehnici avansate de post-training, care ajustează capabilitățile modelului după faza inițială de dezvoltare.

Legate: SemiAnaliză – Nu, scalarea AI nu încetinește

Această abordare asigură că Phi-4 excelează în aplicații vizate, cum ar fi raționamentul matematic , fără ineficiența asociată adesea cu modele mai mari și mai generalizate.

„Phi-4 continuă să depășească granița dimensiunii față de calitate”, a declarat Microsoft în cadrul său oficial anunț, subliniind că modelul contestă ipoteza că performanța este direct legată de scară Prin optimizarea proceselor sale de formare, Microsoft a demonstrat că modelele mici pot atinge excelența specializată, deschizând calea pentru soluții AI mai eficiente.

Eficiența Phi-4 ar putea duce la o adoptare mai rapidă a IA pentru întreprinderi, deși sunt puternice, deseori necesită resurse de calcul extinse, crescând costurile și limitând accesibilitatea lor la organizațiile cu robuste. infrastructurile tehnologice Phi-4, în schimb, oferă o alternativă rentabilă care menține performanța ridicată.

Această accesibilitate este de așteptat să accelereze integrarea AI în industrii, în special în domeniile în care precizia și eficiența costurilor sunt critice. , cum ar fi finanțele, asistența medicală și cercetarea științifică.

Implementarea AI prin Azure AI Foundry

Angajamentul Microsoft pentru dezvoltarea etică a IA este evidentă în lansarea controlată a Phi-4. Inițial pus la dispoziție prin Azure AI Foundry, modelul este distribuit sub o licență de cercetare pentru a permite dezvoltatorilor și cercetătorilor să-și evalueze capacitățile, minimizând în același timp riscurile potențiale. Microsoft intenționează să extindă accesul prin platforme precum Hugging Face, permițând o utilizare mai largă, menținând în același timp garanțiile.

Platforma Azure AI Foundry include o suită de instrumente concepute pentru a promova implementarea responsabilă a AI. Funcții precum filtrarea conținutului, scuturile prompte și detectarea temeiului îi ajută pe dezvoltatori să atenueze riscurile și să se asigure că rezultatele modelului sunt exacte și adecvate.

Redefinirea priorităților de dezvoltare a AI

Realizările Phi-4 nu sunt doar tehnice; ele reprezintă o schimbare mai largă în modul în care AI este conceptualizată și dezvoltată. De ani de zile, industria a acordat prioritate construirii de modele mai mari, presupunând că dimensiunea se corelează cu capacitatea. Cu toate acestea, Phi-4 demonstrează că antrenamentul concentrat și proiectarea eficientă pot obține rezultate superioare fără ineficiența sistemelor masive.

Prin depășirea rivalilor mai mari în criterii de referință specifice și sarcini de rezolvare a problemelor, Phi-4 provoacă cele dominante „ mentalitatea pe scară mai întâi în cercetarea AI.

Succesul său sugerează că viitorul inteligenței artificiale ar putea consta în dezvoltarea unor modele mai mici și mai inteligente. adaptată pentru a răspunde nevoilor specifice Această abordare nu numai că reduce consumul de resurse, ci și face ca instrumentele avansate de inteligență artificială să fie accesibile pentru o gamă mai largă de utilizatori, de la întreprinderi la cercetători individuali.

Introducerea Phi-4 oferă o soluție practică unora. dintre provocările care au limitat adoptarea AI până acum – cerințele hardware și costul.

Noul model Phi-4 Small AI de la Microsoft depășește rivalii mai mari în matematică

Published by All Things Windows on December 13, 2024

Phi-4 Precizie în rezolvarea problemelor

Rolul datelor sintetice și post-formare

Implementarea AI prin Azure AI Foundry

Redefinirea priorităților de dezvoltare a AI

IT Info

Matt Mullenweg elimină conturile WordPress ale dezvoltatorului Yoast și ale altor colaboratori cheie

IT Info

FTC și DOJ ridică preocupări antitrust în procesul OpenAI al lui Musk

IT Info

4 moduri simple de a deschide terminalul în Windows 11

Noul model Phi-4 Small AI de la Microsoft depășește rivalii mai mari în matematică

Published by All Things Windows on December 13, 2024

Phi-4 Precizie în rezolvarea problemelor

Rolul datelor sintetice și post-formare

Implementarea AI prin Azure AI Foundry

Redefinirea priorităților de dezvoltare a AI

Related Posts

IT Info

Matt Mullenweg elimină conturile WordPress ale dezvoltatorului Yoast și ale altor colaboratori cheie

IT Info

FTC și DOJ ridică preocupări antitrust în procesul OpenAI al lui Musk

IT Info

4 moduri simple de a deschide terminalul în Windows 11