Ang mga bagong granite 4.0 na mga modelo ng IBM ay bumagsak sa mga gastos sa hybrid na Mamba-Transformer na arkitektura

Ang

IBM ay naglunsad ng mga bagong modelo ng Granite 4.0 AI, na nag-aalok ng isang pangunahing paglukso sa kahusayan para sa mga negosyo. target=”_ blangko”> mamba-2 at transpormer arkitektura. Ang pamamaraang ito ay pinuputol ang mga pangangailangan ng memorya ng higit sa 70 porsyento, na nagpapababa ng mga gastos sa hardware para sa mga kumplikadong gawain.

Ang mga modelo ay itinayo para sa paggamit ng negosyo, na nakatuon sa tiwala at mataas na pagganap. Magagamit na sila ngayon sa IBM’s watsonx.ai , Hugging Face , at iba pang mga platform. src=”data: imahe/svg+xml; nitro-empty-id=mty0otoxmjg1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropsixmjgwiibozwlnahq9ijCyMcigeg1Sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

granite 4.0 marka Ang paglipat ng IBM upang magbigay ng isang malakas ngunit abot-kayang tool ng AI para sa pandaigdigang merkado, ang pagpoposisyon nito bilang isang pangunahing katunggali. Contender. Ginagawa nitong mahal ang mga ito. Sila mas mahusay na angkop para sa mga mahabang dokumento . Pinapanatili nito ang katumpakan ng konteksto na kilala ng mga transformer habang ginagamit ang bilis at kahusayan ng memorya ng Mamba. href=”https://www.aiml.com/ibm-launches-lranite-4-0-hybrid-ai-models-with-lower-memory-and-hardware-costs/”target=”_ blangko”> Pagbababa ng hadlang sa pagpasok para sa maraming mga organisasyon . Ang mga mananaliksik ay naggalugad ng iba’t ibang mga pamamaraan, mula sa mga haka-haka na mga cascades ng Google hanggang sa mga diskarte sa pag-compress ng Google tulad ng DFLOAT11, ang lahat ay naglalayong gawing mas naa-access at sustainable ang mga malalaking modelo. Ang pagbabago sa arkitektura ng IBM ay isang pangunahing pagpasok sa larangang ito. Inaangkin ng kumpanya ang bagong arkitektura ay maaaring masira ang mga kinakailangan sa memorya ng GPU sa pamamagitan ng higit sa 70% sa panahon ng pag-iintindi, lalo na para sa mga workload na may mahabang konteksto o maraming sabay-sabay na mga gumagamit. Ito ay isinasalin nang direkta sa mas mababang mga gastos sa pagpapatakbo.

Ang pamilyang Granite 4.0 ay may kasamang maraming laki upang magkasya sa iba’t ibang mga pangangailangan. Nagtatampok ang lineup ng dalawang mga modelo ng halo-ng-eksperto (MOE), H-Small (~ 9B aktibong mga parameter) at H-malyy (~ 1B aktibo), sa tabi ng isang siksik na 3B hybrid model. Ang modelo ng granite-4.0-h-maliit ay higit sa mga gawain na sumusunod sa pagtuturo (ifeval) at lubos na mapagkumpitensya sa pagtawag sa function (BFCLv3), ayon sa data ng IBM. src=”data: imahe/svg+xml; nitro-empty-id=mty1nzoxndk1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca2ndai Ihdpzhropsixmjgwiibozwlnahq9ijy0mcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Ipinapakita nito ang kanilang pagiging handa para sa kumplikado, ahente ng mga daloy ng ahente na karaniwan sa mga setting ng negosyo. Sanayin din sila sa mga sample na pagkakasunud-sunod hanggang sa 512K mga token ng haba, tinitiyak ang matatag na pagganap sa mga gawain na nangangailangan ng napakahabang mga bintana ng konteksto. Ang Granite 4.0 ay pinakawalan sa ilalim ng lisensya ng Apache 2.0, na hinihikayat ang malawak na pag-aampon at pagbabago. href=”https://www.iso.org/standard/88934.htm”target=”_ blangko”> nakamit ang ISO/IEC 42001: 2023 sertipikasyon . Mga Industriya. Plano ng kumpanya na palawakin ang pamilya na may mga variant na nakatuon sa pangangatuwiran na”pag-iisip”mamaya sa 2025.

Ang mga bagong granite 4.0 na mga modelo ng IBM ay bumagsak sa mga gastos sa hybrid na Mamba-Transformer na arkitektura

Published by All Things Windows on October 3, 2025

IT Info

Paano ihinto ang Google Chrome mula sa paglalagay ng mga tukoy na site (mga tab) sa pagtulog

IT Info

Paano ipasok ang emoji sa PowerPoint (Windows & Mac)

IT Info

Huwag paganahin ang copilot sa PowerPoint: 5 madaling paraan

Ang mga bagong granite 4.0 na mga modelo ng IBM ay bumagsak sa mga gastos sa hybrid na Mamba-Transformer na arkitektura

Published by All Things Windows on October 3, 2025

Related Posts

IT Info

Paano ihinto ang Google Chrome mula sa paglalagay ng mga tukoy na site (mga tab) sa pagtulog

IT Info

Paano ipasok ang emoji sa PowerPoint (Windows & Mac)

IT Info

Huwag paganahin ang copilot sa PowerPoint: 5 madaling paraan