IBM har lansert sine nye Granite 4.0 AI-modeller, og tilbyr et stort sprang i effektivitet for bedrifter.
Utgitt denne uken bruker open source-familien en ny hybriddesign, mixing mamba-2 og transformator Arkitekturer. Denne tilnærmingen kutter hukommelsesbehov med over 70 prosent, noe som senker maskinvarekostnadene for komplekse oppgaver.
Modellene er bygget for bedriftsbruk, med fokus på tillit og høy ytelse. De er nå tilgjengelige på ibm’s watsonx.ai , Hugging Face og andre plattformer. src=”https://winbuzzer.com/wp-content/uploads/2025/10/ibm-building.jpg”>
granite 4.0 markerer IBMs grep for å gi en kraftig AI i det globale markedet, og posisjonere det som en nøkkelkonkurranse.
dette som er en kraftig. AI-landskap.
Med Metas nylige snubler og den raske økningen av mektige kinesiske modeller som Qwen, har industrien sett på en sterk amerikansk utfordrer.
En hybrid arkitektur for å takle AIs effektivitetsproblem
Hjertet av grensen. Transformatormodeller.
Tradisjonelle arkitekturer lider av en”kvadratisk flaskehals”, der behandlingen krever firedobling når inngangslengden fungerer. Dette gjør dem dyre å kjøre.
IBMs nye modeller gir dette problemet ved å blande to forskjellige arkitekturer. De P> P> P> P> P P> P> P P> Nyere State-Space-modell, behandler informasjon lineært, og gjør den til langt bedre egnet for lange dokumenter .
Denne hybriddesignet avgrenser det beste av begge verdens. Den opprettholder den kontekstuelle nøyaktigheten som transformatorer er kjent for mens de utnytter hastigheten og hukommelseseffektiviteten til mamba.
Resultat Target=”_ Blank”> Senking av inngangsbarrieren for mange organisasjoner .
Flyttingen er en del av et bredere bransjer for AI-effektivitet. Forskere undersøker forskjellige metoder, fra Googles spekulative kaskader til tapsfrie kompresjonsteknikker som DFLOAT11, som alle tar sikte på å gjøre store modeller mer tilgjengelige og bærekraftige. IBMs arkitektoniske innovasjon er en viktig oppføring på dette feltet.
ytelse og praktisk for virksomhetsarbeidsmengder
IBMs fokus er kvadratisk på virksomhetsklasse ytelse og praktisk. Selskapet hevder den nye arkitekturen kan kutte GPU-minnekravene med over 70% under inferens, spesielt for arbeidsmengder med lange kontekster eller mange samtidige brukere. Dette oversettes direkte til lavere driftskostnader.
Granite 4.0-familien inkluderer flere størrelser for å passe til forskjellige behov. Oppstillingen har to modeller med blanding av ekspert (~ 9b aktive parametere) og H Tittel (~ 1b aktiv), sammen med en tett 3B hybridmodell.
en ren 3B-transformator er også tilbudt for plattform som ikke støtter Hybrid-designen.
PN> PLUNS. Granitt-4.0-H-småmodellen utmerker seg ved instruksjonsoppgaver (ifeval) og er svært konkurransedyktig i funksjonsanrop (BFCLV3), ifølge IBMs data.
Dette demonstrerer deres beredskap for komplekse, agent, som var vanlig. //
å håndtere krevende enterpriser. De ble også trent på prøvesekvenser opp til 512K-symboler lange, noe som sikret robust ytelse på oppgaver som krever veldig lange kontekstvinduer.
open source-modeller bygget på et fundament av tillit
utover ytelse, IBM legger vekt på tillit og ansvarlig styring. Granite 4.0 frigjøres under den tillatte Apache 2.0-lisensen, og oppmuntrer til bred adopsjon og modifisering.
Denne åpne tilnærmingen er en klar differensierer i et marked som ofte er dominert av lukkede, proprietære systemer.
I en første for open source-modeller har granittfamilien oppnådd ISO/IEC 42001: 2023 Sertifisering . /P> Denne internasjonale standarden-verifiseringen som IBMs AI-styringsmøte for RIGT til RIGS for å få RIGS for å få en lette krav til RIGS for å få enter for å få en Regulerte næringer.
For å ytterligere styrke sikkerhet er hver modellkontrollpunkt kryptografisk signert, slik at utviklere kan bekrefte sin ekthet og integritet.
Dets engasjement for et åpent og sikkert økosystem er sentralt i IBMs strategi. Selskapet planlegger å utvide familien med resonneringsfokuserte”tenkende”varianter senere i 2025.