A
IBM elindította az új Granite 4.0 AI modelleket, amelyek jelentős hatékonyságot kínálnak a vállalkozások számára. Target=”_ üres”> mamba-2 és Transformer Építészet. Ez a megközelítés több mint 70 százalékkal csökkenti a memóriaigényt, ami csökkenti a komplex feladatok hardverköltségeit. Most már elérhetők a ibm’s watsonx.ai , , claring=”_ blank”> href=”https://huggingface.co/collections/ibm-granite/granite-4-0-ganguage-models-6811a18b820ef362d9e5a82c”Target=”_ üres”> Face és más platformok. src=”adatok: image/svg+xml; nitro-üres-id=mty0oToxmjg1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mJ Aiihdpzhropsixmjgwiibozwlnahq9ijcymcygeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2z4=”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>
Granite 4.0 jelek Az IBM mozdulata egy erőteljes, mégis megfizethető AI eszköz biztosítása érdekében a globális piac számára, amely kulcsfontosságú versenytársként helyezkedik el. Contender. Ez drága futásuk miatt. Ők Kombináljuk a nagyon hatékony mamba-2 rétegeket egy kis számú tradicionális transzformátor blokkkal, egy 9: 1 arányban. A modell, lineárisan feldolgozza az információkat, így sokkal jobban megfelel a hosszú dokumentumokhoz . Fenntartja azt a kontextuális pontosságot, amelyről a transzformátorok ismertek, miközben kihasználják a Mamba sebességét és memóriahatékonyságát. href=”https://www.aiml.com/ibm-lakunches-granite-4-0-hybrid-ai-models-with-lower-memory-and-hardware-costs/”Target=”_ üres”> Számos szervezet számára a belépés akadályának csökkentése. A kutatók különféle módszereket vizsgálnak, a Google spekulatív kaszkádjától a veszteség nélküli kompressziós technikákig, például a DFLOAT11, mindegyike arra törekszik, hogy a nagy modellek hozzáférhetőbbé és fenntarthatóbbá váljanak. Az IBM építészeti innovációja a fő bejegyzés ezen a területen. A társaság azt állítja, hogy az új architektúra a következtetés során több mint 70%-kal csökkentheti a GPU memóriaigényét, különösen hosszú kontextusú vagy sok egyidejű felhasználó munkaterhelése esetén. Ez közvetlenül az alacsonyabb működési költségekké alakul. A felállás két szakember (MOE) keverék (MOE) modellt, a H-Small (~ 9B aktív paraméterek) és a H-Tiny (~ 1B aktív), a sűrű 3B hibrid modell mellett. Az IBM adatai szerint a gránit-4.0-o-small modell kiemelkedik az utasításkövető feladatoknál (IFEVAL), és nagyon versenyképes a függvényhívásban (BFCLV3). src=”adatok: image/svg+xml; nitro-üres-id=mty1nzoxndk1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca2ndai Ihdpzhropsixmjgwiibozwlnahq9ijy0mcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2z4=”>
Ez azt mutatja, hogy készen állnak az üzleti környezetben közös összetett, ügynöki munkafolyamatokra. Emellett mint 512 ezer token mintavételi szekvenciákon is képzettek, biztosítva a robusztus teljesítményt a nagyon hosszú kontextusú ablakokat igénylő feladatokon. A Granite 4.0 a Permissive Apache 2.0 licenc alatt jelenik meg, ösztönözve a széles körű alkalmazást és módosítást. Target=”_ üres”> elért ISO/IEC 42001: 2023 tanúsítás . A hitelesség és az integritás.
A nyitott és biztonságos ökoszisztéma iránti elkötelezettsége központi szerepet játszik az IBM stratégiájában. A társaság azt tervezi, hogy a családot az érvelés-központú „gondolkodás” variánsokkal, 2025-ben később tervezi.