Nowy front otworzył się w chińskim wyścigu sztucznej inteligencji. Minimax z siedzibą w Szanghaju wydał minimax-M1, potężny model rozumowania z otwartą wagą, który podnosi bezpośrednie i wieloprodukowane wyzwanie dla domniemanej dominacji krajowej rywala Deepseek. Ten ruch eskaluje regionalną konkurencję z bitwy wzorców do bardziej złożonej wojny, która walczyła o wydajność, koszt wydajności i samą definicję „open source”.
W strategicznym uruchomieniu Minimax pozycjonuje swój model M1 jako doskonałą alternatywę dla programistów. Według Raport z rejestru , firma wyraźnie dąży do donięcia podatku deepseek jako kluczowego zaburzenia branży. Do tego tygodnia aktualizowany model R1-0528 Deepseek był powszechnie postrzegany jako wiodący kandydata w Chinach open source.
Minimax, jednak twierdzi w
Bitwa o wskaźnikach i architekturze
na papierze, minimax-m1 Prester a Clevable Engineering. Model oficjalne repozytorium GitHub szczegółowo opisuje hybrydową mieszankę mieszanki-experts (moe), która obsługuje okno kontekstowe o jednej milionie tokenu-Ostateczne czasy pojemności deepseek R1. raz. Podczas gdy oba modele wykorzystują technikę MOE wzmacniającą wydajność, Minimax twierdzi, że jego zastrzeżony mechanizm „uwagi błyskawicy” i nowy algorytm uczenia się wzmocnienia o nazwie CISPO są kluczowymi wyróżnikami.
Ta architektura przekłada się na znaczne oszczędności kosztów. Zgodnie z oficjalny artykuł techniczny Ten projekt jest podstawą wydajności modelu. „W porównaniu z DeepSeek… To znaczne zmniejszenie kosztów obliczeniowych sprawia, że M1 jest znacznie bardziej wydajny podczas szkolenia zarówno w wnioskowaniu, jak i na dużą skalę.”
Minimax twierdzi, że w przypadku złożonych zadań rozumowania M1 wymaga tylko około 30 procent siły obliczeniowej R1. Podczas gdy zgłoszone przez siebie testy porównawcze pokazują niuansowy obraz-z Deepseek utrzymując niewielką przewagę w niektórych testach kodowania-M1 wydaje się wyciągać naprzód w zadaniach rozumowania długotertowego, co jest zdolnością krytyczną dla wyrafinowanych zastosowań.
Więcej niż licencja: Open-Source Gambit
Być może najbardziej strategicznym ruchem minimax jest wybór licencji. Firma wydała M1 pod licencja Apache 2.0 , która wyraźnie okra się jako „faktycznie otwarte źródło”. Jest to celowe dźgnięcie w konkurentach, takich jak Meta, których modele LLAMA używają ograniczającej licencji społeczności, którą argumentuje inicjatywa open source to nie naprawdę otwarte źródło , a nawet Deepseek, co jest częściowo częściowo w mole. licencja.
Rozróżnienie jest więcej niż filozoficzne; Ma znaczące implikacje prawne i komercyjne. Licencja Apache 2.0 stanowi kluczową przewagę dla rozwoju sztucznej inteligencji, ponieważ obejmuje również dotacje patentowe, które mogą być ważne dla modeli AI. Ta jawna dotacja patentowa oferuje użytkownikom silniejszą ochronę przed potencjalnymi procesami sądowymi, co jest kluczowe dla przedsiębiorstw, które chcą budować produkty komercyjne oprócz modelu otwartych. Oferując tę jasność prawną, minimax dokonuje obliczonej gry, która jest postrzegana jako bezpieczniejszy, bardziej przyjazny dla biznesu wybór.
Korona pod oblężeniem: destylacja i nieufność
Wyzwanie minimax nie mogło nastąpić w bardziej odpowiednim momencie, tak jak przywództwo Deepseeka zostało zachowane przez kontrowersyjne. Firma zmaga się z szeregiem szkodliwych zarzutów dotyczących swoich danych szkoleniowych.
Spekulacje pojawiły się po raz pierwszy wokół wykorzystania modeli Openai, że najnowszy model Deepseek mógł zostać przeszkolony w zakresie danych z Google Gemini. Ta praktyka narusza warunki obsługi większości głównych laboratoriów AI. Zarzuty są spotęgowane przez intensywną presję geopolityczną.
W kwietniu amerykańska komitet wyboru House ds. CCP uznał Deepseek zagrożenie dla bezpieczeństwa narodowego, a przewodniczący John Moolenaar wydał ostrzeżenie. „Deepseek to nie tylko kolejna aplikacja AI-jest bronią w arsenale chińskiej partii komunistycznej, zaprojektowanej do szpiegowania Amerykanów, kradzieży naszej technologii i obalenia prawa USA.”
Niektórzy eksperci, jak badacz AI, Nathan Lambert, zasugerowali, że dla firmy stojącej przed pracownikami GPU z powodu sankcji amerykańskich z powodu sankcji amerykańskich jest logiczną, jak ryzykowne, skierowane do pozostania.
Gdybym był głęboko zakorzeniony, zdecydowanie stworzyłbym tonę danych syntetycznych z najlepszego modelu API. Niszczą GPU i spłukiwają gotówką. Jest to dosłownie bardziej dla nich obliczeni. Tak w pytaniu o destylację Gemini.
-Nathan Lambert (@natolambert)
Globalny wyścig napędzany przeszkodami
Podczas gdy dramat rozwija się w Chinach, globalny wyścig AI okazuje się żałosny dla wszystkich. Wyzwania, przed którymi stoją Deepseek i presja konkurencyjna ze strony Minimax, są odzwierciedlone na Zachodzie, gdzie nawet najbardziej dobrze finansowani giganci technologiczni uderzają w dróg rozwoju.
W znacznym niepowodzeniu Meta została zmuszona do odłożenia swojego flagowego modelu Behemoth 4 Behemoth w maju z powodu problemów z wydajnością. Ta walka w branży sugeruje, że era łatwych, szybkich postępów może się zakończyć. Jak zauważył adiunkt NYU, profesor Ravid Shwartz-Ziv, „postęp jest dość mały we wszystkich laboratoriach, wszystkich modelach.”
Patrząc w przyszłość, wyróżnik konkurencyjny może się całkowicie zmienić. najnowszy raport PWC Na trendach AI sugeruje, że ponieważ modele założycielskie stają się uwolnione, kluczowe, klucz do sukcesu nie będzie miał najlepszego modelu poza tym, ale w swoich firmach z ich silnymi narzędziami sugeruje, że we własnym narzędzi kombinację narzędzi. Zastrzeżone dane i wiedza instytucjonalna.
Pojawienie się minimax podkreśla zmianę w branży AI. Wyzwanie dla Deepseek nie dotyczy tylko wskaźników wydajności, ale jest szerszym konkursem wydajności, strategii prawnej i postrzeganej wiarygodności. Ponieważ globalny rasa nadal przyspiesza, ta wielofitowta konkurencja w Chinach pokazuje, że budowanie dominującego modelu AI wymaga teraz czegoś więcej niż tylko kodu-wymaga opanowania złożonej wzajemnej zależności między technologią, etyką i handlem.