IBM ka nisur modelet e saj të reja Granit 4.0 AI, duke ofruar një kërcim të madh në efikasitet për bizneset. target=”_ bosh”> mamba-2 dhe transformator Arkitekturat. Kjo qasje ul nevojat e kujtesës me mbi 70 përqind, e cila ul kostot e harduerit për detyra komplekse.
Modelet janë ndërtuar për përdorimin e ndërmarrjeve, duke u përqëndruar në besim dhe performancë të lartë. Ato janë në dispozicion tani në Watsonx.ai i IBM.ai , shumë më të përshtatshme për dokumente të gjata .
Ky dizajn hibrid jep më të mirën e të dy botëve. Ai mban saktësinë kontekstuale që transformatorët njihen ndërsa shfrytëzojnë shpejtësinë dhe efikasitetin e kujtesës së mamba. href=”https://www.aiml.com/ibm-launches-ganite-4-0-hybrid-ai-models-with-lower-memory-and-hardware-costs/”target=”_ bosh”. Studiuesit po eksplorojnë metoda të ndryshme, nga kaskadat spekulative të Google deri tek teknikat e kompresimit pa humbje si DFLOAT11, të gjithë synojnë t’i bëjnë modelet e mëdha më të arritshme dhe të qëndrueshme. Inovacioni arkitektonik i IBM është një hyrje e madhe në këtë fushë. Kompania pretendon se arkitektura e re mund të zvogëlojë kërkesat e kujtesës GPU me mbi 70% gjatë konkluzionit, veçanërisht për ngarkesat e punës me kontekste të gjata ose shumë përdorues të njëkohshëm. Kjo përkthehet drejtpërdrejt në kosto më të ulëta operacionale.
Familja Granit 4.0 përfshin disa madhësi për t’iu përshtatur nevojave të ndryshme. Rreshtimi përmban dy modele të përzierjes së ekspertëve (MOE), H-small (parametra aktive ~ 9B) dhe H-TYIN (~ 1B aktiv), së bashku me një model hibrid të dendur 3B. Modeli i granitit-4.0-orë i ndëshkuar shkëlqen në detyrat e ndjekjes së udhëzimeve (ifeval) dhe është shumë konkurrues në thirrjen e funksionit (BFCLV3), sipas të dhënave të IBM. src=”të dhëna: image/svg+xml; nitro-impty-id=mty1nzoxndk1-1; base64, phn2zywv3qm94psiwidagmti4mca2ndai Ihdpzhropsixmjgwiibozwlnahq9ijy0mcigeG1Sbnm9imH0dha6ly93d3cudzmUB3jnlziwmdavc3znij48l3n2zz4=”>
Kjo tregon gatishmërinë e tyre për rrjedhën e punës komplekse, agjentë të zakonshme në mjediset e biznesit. Ata gjithashtu u trajnuan në sekuencat e mostrës deri në 512K të gjatë, duke siguruar performancë të fortë në detyra që kërkojnë dritare shumë të gjata të kontekstit. Granit 4.0 lëshohet nën licencën lejuese Apache 2.0, duke inkurajuar adoptimin dhe modifikimin e gjerë. Target=”_ bosh”> arriti ISO/IEC 42001: 2023 Certifikimi Autenticiteti dhe integriteti.
Angazhimi i tij për një ekosistem të hapur dhe të sigurt është thelbësor për strategjinë e IBM. Kompania planifikon të zgjerojë familjen me variante”të menduarit”të përqendruara në arsyetim më vonë në vitin 2025.