IBM lançoi sot familjen e saj Granite 4.0 Nano, një linjë e re e modeleve të AI me burim të hapur, të krijuar për efikasitet ekstrem.
Të lëshuar më 29 tetor 2025, këto modele janë mjaft të vogla për t’u ekzekutuar në laptopë dhe madje direkt në një shfletues ueb, duke sfiduar fokusin e industrisë në sistemet masive, me përmasa të lidhura me serverin 3, të lidhura me serverin, vetëm 3,00. Familja Nano synon të bëjë AI të fuqishme të arritshme për zhvilluesit dhe bizneset pa kërkuar infrastrukturë të shtrenjtë cloud.
Lëshimi, pas debutimit të modeleve më të mëdha Granite 4.0 më herët në tetor, sinjalizon një shtytje strategjike drejt AI më të vogël dhe më të aksesueshme për aplikacionet kompjuterike në pajisje dhe ato të skajshme.
Modele të vogla, akses i madh: Nano funksionon në laptopin tuaj
më mirë’IBM’s’s’Ch Lëvizja e fundit i jep përparësi efikasitetit dhe aksesit në shkallë të gjerë. Familja Granite 4.0 Nano përfshin Granite 4.0 Nano modele, duke filluar nga 350 milionë parametra të vegjël deri në një version më të aftë prej 1,5 miliardë parametrash.
Dizajni i tyre i bën ato ideale për zhvilluesit që ndërtojnë aplikacione në harduerin e konsumatorit ose në skajet, ku mbështetja në renë kompjuterike është jopraktike. Qëllimi është fuqizimi i një klase të re aplikacionesh AI që vlerësojnë privatësinë, vonesën e ulët dhe pavarësinë nga qendrat e kushtueshme të të dhënave.
Variantet më të vogla mund të funksionojnë të qetë në një laptop modern me 8-16 GB RAM. Në një demonstrim të dukshëm të butësisë së tyre, Joshua Lochner, një inxhinier i mësimit të makinerive në Hugging Face, konfirmoi se”ato më të voglat mund të funksionojnë edhe në nivel lokal në shfletuesin tuaj të internetit,”.
Ky nivel aksesueshmërie ul pengesën e hyrjes për zhvilluesit dhe bizneset e vogla, duke mundësuar një zhvendosje drejt AI-së së parë lokale.
Familja është e ndarë në dy stile arkitekturore për të maksimizuar fleksibilitetin. Dy modele, Granite-4.0-H-1B dhe H-350M, përdorin hapësirën hibride të gjendjes (SSM) dhe arkitekturën e Transformerit.
Dy të tjerë, Granite-4.0-1B dhe 350M, janë variante të pastër Transformer, duke ofruar përputhshmëri më të gjerë me veglat ekzistuese të plumbit c
IB
llama.p>c. duke vënë në dukje se modeli jo-hibrid 1B është në fakt më afër parametrave 2B, por u emërua për t’u lidhur me motrën e tij hibride.
Ndërsa varianti rhe hibrid është një model i vërtetë 1B, varianti johibrid është më afër 2B. IBM zgjodhi të mbajë emërtimin në linjë me variantin hibrid për ta bërë lidhjen lehtësisht të dukshme.
Pushimi mbi peshën e tyre: Performanca e standardit të Nano-s
Nën kapuç, modelet Nano trashëgojnë të njëjtën arkitekturë inovative që e bëri të rëndësishme familjen fillestare Granite 4.0.
Duke kombinuar një numër më të madh të performancës së këtyre modeleve të niveleve më të vogla të shtresave tradicionale të Mamba-2, duke arritur një numër më të madh të performancës së këtyre modeleve më efikase të shtresave tradicionale të Mamba-2. një buxhet.
Kjo qasje hibride trajton drejtpërdrejt”grykën e ngushtë kuadratike”të modeleve të pastër të Transformerit, ku kërkesat për përpunim rriten me rritjen e gjatësisë së hyrjes.
Theksimi sasior më domethënës është fitimi dramatik i efikasitetit: modelet e reja hibride mund të zvogëlojnë kërkesat e memories së GPU-së gjatë një ngarkese të gjatë, veçanërisht me mbi 70% përdoruesit.
Kjo zgjedhje arkitektonike është pjesë e një gare më të gjerë të industrisë për efikasitetin e AI, me kompani si Google që eksplorojnë metoda të reja për të reduktuar kostot llogaritëse dhe studiues që zhvillojnë teknika të reja kompresimi.
Pavarësisht gjurmës së tyre minimale, modelet Nano japin rezultate mbresëlënëse në standardet kryesore të industrisë (një konkurrencë të drejtpërdrejtë të gjuhëve të vogla SLM, duke i vendosur ato në gjuhë të vogla SLM) Qwen3 dhe Gemma e Google.
Sipas të dhënave të ndara nga IBM, modeli Granite-4.0-H-1B shënon 78.5 në IFEval për ndjekjen e udhëzimeve, duke tejkaluar modelin më të madh Qwen3-1.7B.
Në testimin e Berkeley-s për testimin e Levelit3 (Berkeley aFCLv3) flukset e punës agjente, varianti Granite-4.0-1B udhëheq klasën e tij të përmasave me një rezultat prej 54,8.
IBM Granite 4.0 Nano Lellingface (Burimi: IBM)
Këto rezultate sugjerojnë se dizajni strategjik dhe të dhënat e trajnimit me cilësi të lartë mund të lejojnë modelet më të vogla të konkurrojnë në mënyrë efektive me ato shumë më të mëdha në detyra të specializuara, të lidhura me ndërmarrjen.
IBM Granite 4.0 Nano Berkeley Function Calling Leaderboard v3 (BFCLv3) (Burimi: IBM)
Një fondacion i hapur dhe i besuar për AI të ndërmarrjeve
Për zhvilluesit dhe bizneset që janë të kujdesshëm ndaj bllokimit të shitësve, modaliteti lejues komercial ofron licencën, lirinë, përdorimin e modelit të rëndësishëm dhe shpërndarjen e Apache 2. qëllimet.
Kjo qasje e hapur është një pjesë thelbësore e strategjisë së IBM për të ndërtuar një ekosistem të besueshëm rreth modeleve të Granitit, duke i pozicionuar ato si një alternativë e besueshme perëndimore ndaj modeleve të fuqishme me burim të hapur nga konkurrentët.
Përtej licencës së hapur, IBM po forcon besimin me standardet rigoroze të familjes . href=”https://www.iso.org/standard/42001″target=”_blank”>Çertifikim ISO/IEC 42001:2023, një standard ndërkombëtar që verifikon që sistemi i menaxhimit të AI i IBM plotëson kërkesat strikte për llogaridhënie dhe transparencë. Për të siguruar më tej integritetin, çdo pikë kontrolli kriptografike e zhvilluesve të tij është e kontrolluar në mënyrë të fshehtë. dhe origjina. Angazhimi i drejtpërdrejtë i IBM me komunitetin e zhvilluesve, duke përfshirë një sesion “Më pyesni për ndonjë gjë”në Reddit një mbledhjen e reagimeve për miratimin e nënshkrimeve. Përdoruesit në forum treguan entuziazëm, me një vërejtje:”Kjo është e madhe nëse është e vërtetë për një model 1B… kjo mund të jetë një punë e vërtetë.” Me planet për të nxjerrë modele më të mëdha dhe variante”Të menduarit”të përqendruar në arsyetim më vonë në 2025, familja Nano duket se e bën hapin e parë të prodhimit në një realitet më efikas. për një audiencë më të gjerë.