IBM wprowadził na rynek nowe granitowe modele AI 4.0, oferując poważny skok wydajności dla firm.
Wydany w tym tygodniu, rodzina open source używa nowatorskiego projektu hybrydowego, miksowania mamba-2 i transformator architektury. Takie podejście ogranicza potrzeby pamięci o ponad 70 procent, co obniża koszty sprzętu dla złożonych zadań.
Modele są budowane do użytku przedsiębiorstwa, koncentrując się na zaufaniu i wysokiej wydajności. Są one teraz dostępne na ibm’s Watsonx.ai , przytulanie twarzy i innych platform. src=”data: image/svg+xml; nitro-empty-id=mty0otoxmjg1-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropixmjgwiibozwlnahqq9ijCymcigeg1SBNM9IMH0DHA6LY93D3CUDZMUB3JNLZIWMDAVC3ZNIJ48L3N2ZZ4=”>
Granite 4.0 Znaki IBM ruch IBM, aby zapewnić potężne, ale niedrogie narzędzie AI dla rynku globalnego, pozycjonując go jako kluczowego konkurentów.
To wydanie sygnalizuje strategiczne dążenie do IBM do odzyskania roli przywódczej w branży open source.
z niedawnymi wymcami meta i szybkim wzrostem potężnych modeli chiński Kontrender.
Hybrydowa architektura w celu rozwiązania problemu wydajności AI
w sercu granitu 4.0 jest sprytnym rozwiązaniem jednego z największych wyzwań AI: ogromne koszty obliczeniowe modeli transformatorów.
Tradycyjne architektury cierpią z powodu czterokrotnego rozwinięcia, “, w przypadku długości obliczeniowej. To sprawia, że je uruchamiają.
Nowe modele IBM polegają na tym problemu poprzez połączenie dwóch różnych architektur. Oni połącz wysoce wydajne warstwy mamba-2 z niewielką liczbą tradycyjnych bloków transformatorów w 9: 1 Ratio . Model, przetwarza informacje liniowo, dzięki czemu znacznie lepiej dopasowane do długich dokumentów .
Ten hybrydowy projekt zapewnia najlepsze z obu światów. Utrzymuje dokładność kontekstową, z której znane są transformatory, jednocześnie wykorzystując szybkość i wydajność pamięci Mamba.
Wynik jest znaczącą redukcją sprzętu potrzebnego do uruchomienia potężnej AI, obniżanie bariery wejścia dla wielu organizacji .
ruch jest częścią rasy branżowej dla AI. Naukowcy badają różne metody, od spekulacyjnych kaskad Google po bezstratne techniki kompresji, takie jak DFLOAT111, wszystkie mające na celu uczynienie dużych modeli bardziej dostępnymi i zrównoważonymi. Innowacja architektoniczna IBM jest ważnym wpisem w tej dziedzinie.
Wydajność i praktyczność dla obciążeń korporacyjnych
IBM koncentruje się wprost na wydajności i praktyczności klasy korporacyjnej. Firma twierdzi, że nowa architektura może obniżyć wymagania pamięci GPU o ponad 70% podczas wnioskowania, szczególnie w przypadku obciążeń z długimi kontekstami lub wielu jednoczesnych użytkowników. Przekłada się to bezpośrednio na niższe koszty operacyjne.
Rodzina granitu 4.0 obejmuje kilka rozmiarów, aby pasowały do różnych potrzeb. Skład zawiera dwa modele mieszanki ekspertów (MOE), H-Small (~ 9b aktywne parametry) i H Tiny (~ 1B Active), wraz z gęstym modelem hybrydowym 3B.
Oferowany jest również czysty transformator 3B. Model granitu 4,0-H-H-Smaberia wyróżnia się w zadaniach związanych z instrukcjami (IFEVAL) i jest wysoce konkurencyjny w wywoływaniu funkcji (BFCLV3), zgodnie z danymi IBM.
To pokazuje ich gotowość do złożonych, agresywnych przepływów pracy powszechnych w ustawieniach biznesowych.
Aby poradzić sobie z wymagającymi danymi przedsiębiorczymi, modele zostały przeszkolone w odniesieniu do ogromnego korpusu 22-trylionowego. Zostały również przeszkoleni w przypadku próbek o długości do 512 tokenów, zapewniając solidną wydajność zadań wymagających bardzo długiego kontekstowego okien.
Modele open source zbudowane na podstawie zaufania
Poza wydajnością, IBM podkreśla zaufanie i odpowiedzialne zarządzanie. Granite 4.0 jest wydawany na podstawie licencji APACHE 2.0, zachęcając do szerokiego przyjęcia i modyfikacji.
To otwarte podejście jest wyraźnym wyróżnikiem na rynku często zdominowanym przez zamknięte, zastrzeżone systemy.
W pierwszym dla modeli typu open-source rodzina granitowa ma
Ten międzynarodowy standard weryfikuje, że system zarządzania AI IBM spełnia rygorystyczne wymagania dotyczące odpowiedzialności, przejrzystości i prywatności danych, udzielając zapewnienia przedsiębiorstwom przedsiębiorstw w branży regulowanej.
Dalsze bezpieczeństwo, każde modele jest podpisane w zakresie roli, zezwolenie na udzielanie programowania programowania zezwolenia na rzecz programowania zyskujące Jego autentyczność i integralność.
Jego zaangażowanie w otwarty i bezpieczny ekosystem ma kluczowe znaczenie dla strategii IBM. Firma planuje rozwinąć rodzinę o koncentrujące się na rozumowania warianty „myślenia” później w 2025 r.