IBM heeft zijn nieuwe Granite 4.0 AI-modellen gelanceerd en biedt een grote sprong voor in efficiëntie voor bedrijven.

die deze week is uitgebracht, gebruikt de Open-Source-familie een nieuw hybride ontwerp, mixen mamba-2 en transformator architecturen. Deze aanpak verlaagt de geheugenbehoeften met meer dan 70 procent, waardoor de hardwarekosten voor complexe taken worden verlaagd.

De modellen zijn gebouwd voor gebruik van bedrijven, gericht op vertrouwen en hoge prestaties. Ze zijn nu beschikbaar op ibm’s Watsonx.ai , hakging face en andere platforms.

Granite 4.0 markeert IBM’s MOVE om een ​​krachtige AI-tool te bieden voor de wereldwijde markt, het positioneren van de wereldwijde markt, het positioneren van de wereldwijde markt, het positioneren van de wereldwijde markt, het positioneren van de wereldwijde markt, het positioneren van de wereldwijde markt.

Deze release geeft een strategische push van IBM aan om een ​​leidende rol in het open-source AI-landschap terug te vorderen.

Met de recente struikbles van Meta en de snelle opkomst van krachtige Chinese modellen zoals QWen, is de industrie gekeken voor een sterke Amerikaanse contender. 4.0 is een slimme oplossing voor een van de grootste uitdagingen van AI: de immense rekenkosten van transformatiemodellen.

Traditionele architecturen lijden aan een”kwadratisch knelpunt”, waar de verwerking viervoudig vereist wanneer de inputlengte verdubbelt. Dit maakt hen duur om te draaien.

IBM’s nieuwe modellen omzeilen dit probleem door twee verschillende architecturen te combineren. Ze Combineer zeer efficiënte mamba-2 lagen met een klein aantal traditionele transformatieblokken in een 9: 1 ratio . Model, verwerkt informatie lineair, waardoor het veel beter geschikt voor lange documenten .

Dit hybride ontwerp levert het beste van beide werelden. Het behoudt de contextuele nauwkeurigheid waar transformatoren om bekend staan, terwijl het gebruik van de snelheid en geheugenefficiëntie van mamba.

Het resultaat is een significante vermindering van de hardware die nodig is om krachtige AI, Het verlagen van de barrière voor veel organisaties Onderzoekers onderzoeken verschillende methoden, van de speculatieve cascades van Google tot verliesloze compressietechnieken zoals DFLOAT11, allemaal gericht op het toegankelijker en duurzame van grote modellen. De architecturale innovatie van IBM is een belangrijke vermelding op dit gebied.

prestaties en bruikbaarheid voor enterprise workloads

IBM’s focus ligt vierkant op bedrijfsprestaties en praktischheid. Het bedrijf beweert dat de nieuwe architectuur de GPU-geheugenvereisten met meer dan 70% kan verlagen tijdens de gevolgtrekking, vooral voor workloads met lange contexten of veel gelijktijdige gebruikers. Dit vertaalt zich direct in lagere operationele kosten.

De graniet 4.0-familie bevat verschillende maten die aan verschillende behoeften voldoen. De line-up beschikt over twee mengsel-van-experts (MOE)-modellen, H-Small (~ 9b actieve parameters) en H-Tiny (~ 1B actief), naast een dicht 3B-hybride model.

Een pure 3B-transformator wordt ook aangeboden voor platforms die nog geen platforms ondersteunen. Het Granite-4.0-H-Small-model blinkt uit in instructievolle taken (ifeval) en is zeer competitief in functieaanroepen (BFCLV3), volgens de gegevens van IBM.

Dit toont hun gereedheid voor complexe, agentische workflows die gemeenschappelijk zijn in zakelijke instellingen.

om veeleisende bedrijfsgegevens te verwerken, de modellen waren getraind op een massale 22-trilling-taken. Ze werden ook getraind op voorbeeldsequenties tot 512K-tokens lang, waardoor robuuste prestaties op taken voor zeer lange contextvensters nodig zijn.

open-source modellen gebouwd op een basis van vertrouwen

Naast prestaties is IBM de nadruk op het vertrouwen en verantwoordelijk bestuur. Granite 4.0 wordt uitgebracht onder de Permissive Apache 2.0-licentie, die brede adoptie en aanpassing aanmoedigt.

Deze open aanpak is een duidelijke onderscheidende factor in een markt die vaak wordt gedomineerd door gesloten, eigen systemen.

In een primeur voor open-source modellen, de granietfamilie heeft heeft ISO/IEC 42001: 2023 certificering bereikt .

Deze internationale standaard verifieert dat het AI-managementsysteem van IBM voldoet aan rigoureuze vereisten voor verantwoordelijkheid, transparantie en gegevensprivacy, wat voor bedrijfsonderzoekers is. Authenticiteit en integriteit.

De toewijding aan een open en veilig ecosysteem staat centraal in de strategie van IBM. Het bedrijf is van plan het gezin uit te breiden met redenering gerichte”denkende”varianten later in 2025.

Categories: IT Info