IBM și-a lansat astăzi familia Granite 4.0 Nano, o nouă linie de modele open-source AI concepute pentru o eficiență extremă.
Lansate pe 29 octombrie 2025, aceste modele sunt suficient de mici pentru a rula pe laptopuri și chiar direct într-un browser web, provocând concentrarea industriei pe sisteme masive, legate de servere, de la abia parametru de dimensiunea a 3-a. Familia Nano își propune să facă AI puternică accesibilă dezvoltatorilor și companiilor fără a necesita o infrastructură cloud costisitoare.
Lansarea, după debutul modelelor mai mari Granite 4.0 la începutul lunii octombrie, semnalează un impuls strategic către IA mai mică și mai accesibilă pentru aplicații de calcul pe dispozitiv și edge.
Modele mici, accesibilitate mare: Nano rulează pe laptopul tău
Provocarea mai multor eficiență a industriei este mai bună. și accesibilitatea la scară largă. Familia Granite 4.0 Nano include ranite-4-ana> minuscule 350 de milioane de parametri la o versiune mai capabilă de 1,5 miliarde de parametri.
Designul lor îi face ideali pentru dezvoltatorii care construiesc aplicații pe hardware de consum sau la margine, unde dependența de cloud este imposibilă. Scopul este de a împuternici o nouă clasă de aplicații AI care pun în valoare confidențialitatea, latența scăzută și independența față de centrele de date costisitoare.
Cele mai mici variante pot funcționa confortabil pe un laptop modern cu 8-16 GB de RAM. Într-o demonstrație notabilă a ușurinței lor, Joshua Lochner, un inginer de învățare automată la Hugging Face, a confirmat că „cele mai mici pot rula chiar și local pe propriul browser web,” a făcut ca familia inițială Granite 4.0 să fie demnă de remarcat.
Combinând straturi de Mamba-2 extrem de eficiente, cu un număr redus de modele tradiționale, aceste modele obțin performanțe semnificative pe un număr mic de modele tradiționale.
Această abordare hibridă abordează direct „gâtul de sticlă pătratic” al modelelor pure Transformer, în care cerințele de procesare cresc pe măsură ce lungimea intrării crește.
Cel mai important punct de atracție cantitativ este câștigul dramatic al eficienței: noile modele hibride pot reduce cerințele de memorie GPU cu peste 70% în timpul inferenței, în special pentru sarcini de lucru cu contexte lungi sau mulți utilizatori simultani de arhitectură. Cursa industriei pentru eficiența inteligenței artificiale, cu companii precum Google care explorează metode noi de reducere a costurilor de calcul și cercetători dezvoltând noi tehnici de compresie.
În ciuda amprentei lor minime, modelele Nano oferă rezultate impresionante pe repere cheie ale industriei, plasându-le în concurență directă cu modele de limbaj mici (SLM) consacrate, cum ar fi Qwen3 de la Alibaba și Gemma de la Google. scor 78,5 la IFEval pentru urmărirea instrucțiunilor, depășind modelul mai mare Qwen3-1.7B.
Pe Berkeley Function Calling Leaderboard (BFCLv3), un test critic pentru fluxurile de lucru agentice, varianta Granite-4.0-1B conduce clasa sa de mărime cu un scor de 54,8.
IBM Granite 4.0 Nano Berkeley Function Calling Leaderboard v3 (BFCLv3) (Sursa: IBM)
Aceste rezultate sugerează că proiectarea strategică și datele de instruire de înaltă calitate pot permite modelelor mai mici să concureze eficient cu altele mult mai mari pe sarcini specializate. înălțime=”719″src=”data:image/svg+xml;nitro-empty-id=MTY3MToxODAx-1;base64,PHN2ZyB2aWV3Qm94PSIwIDAgMTI4MCA3MTki IHdpZHRoPSIxMjgwIiBoZWlnaHQ9IjcxOSIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj48L3N2Zz4=”>IBM Granite 4.0 Nano Berkeley Function Calling Leaderboard v3 (BFCLv3) (Sursa: IBM)
O fundație deschisă și de încredere pentru Enterprise AI
Pentru dezvoltatorii și companiile care se tem de blocarea furnizorilor, licența permisivă Apache 2.0 oferă libertate semnificativă de a utiliza, modifica și chiar distribuie modele deschise în scop comercial. parte esențială a strategiei IBM de a construi un ecosistem de încredere în jurul modelelor sale Granite, poziționându-le ca o alternativă occidentală de încredere la modelele puternice open-source de la concurenți.
Dincolo de licența deschisă, IBM întărește încrederea cu standarde riguroase de guvernare.
Familia Granite este prima serie de modele open-source care atinge Certificare ISO/IEC 42001:2023, un standard internațional care verifică că sistemul de management AI al IBM îndeplinește cerințe stricte de responsabilitate și transparență.
Pentru a asigura și mai mult integritatea, fiecare punct de control al modelului este semnat criptografic, permițând dezvoltatorilor să verifice autenticitatea și originea acestuia, inclusiv cu comunitatea dezvoltatorilor, implicarea directă a
i IBM. href=”https://www.reddit.com/r/LocalLLaMA/comments/1oichb7/granite_40_nano_language_models”target=”_blank”>Sesiunea „Ask Me Anything” de pe Reddit, semnalează angajamentul de a promova adopția și de a strânge feedback.
Utilizatorii de pe forum arată că, dacă remarcă este mare, este adevărat. pentru un model 1B… acesta ar putea fi un adevărat cal de bătaie.”
Cu planurile de a lansa modele mai mari și variante de „Gândire” centrate pe raționament mai târziu în 2025, familia Nano pare să fie doar primul pas într-o strategie mai amplă de a face AI eficientă, pregătită pentru producție, o realitate pentru un public mai larg.