Alibaba Cloud ogłosiła obniżkę ceny o 85% na swój model AI rozumujący wizualnie, Qwen-VL-Max. ruch następuje w momencie, gdy chińscy giganci technologiczni, w tym ByteDance i Baidu, walczą o dominację w szybko rozwijającym się sektorze sztucznej inteligencji dla przedsiębiorstw.
Obniżone ceny, które pozycjonują Qwen-VL-Max przy cenie 0,003 juana (0,00041 USD) za tysiąc tokenów odzwierciedla agresywną strategię ByteDance mającą na celu obniżenie kosztów za wprowadzony na rynek w grudniu model AI oparty na wizualnym rozumowaniu.
Seria Qwen-VL firmy Alibaba obejmuje kilka innych zaawansowanych modeli, które integrują dane wizualne i tekstowe na potrzeby takich zadań, jak dodawanie podpisów do obrazów, wizualne odpowiadanie na pytania i generowanie treści multimodalnych. W skład zestawu wchodzą Qwen-VL, Qwen-VL-Chat, Qwen2-VL i eksperymentalny QVQ-72B-Preview. Qwen2-VL dzięki swojej najnowocześniejszej wydajności wyróżnia się w testach porównawczych, takich jak MathVista i DocVQA, często przewyższając wiodących konkurentów, takich jak GPT-4V OpenAI i Gemini Ultra firmy Google.
Z ponad Po zatwierdzeniu w tym roku 252 generatywnych modeli sztucznej inteligencji w Chinach rynek uległ nasyceniu, co skłoniło firmy do przyjęcia innowacyjnych strategii cenowych i technologicznych w celu zabezpieczenia udziału w rynku.
Strategiczne ustalanie cen jako spójny wzorzec
Grudniowe ogłoszenie jest trzecią dużą zmianą cen AI dokonaną przez Alibaba w 2024 r., po 55% obniżce w lutym na podstawowe produkty w chmurze i 97% obniżce w maju na pakiet Qwen AI. Posunięcia te odzwierciedlają konsekwentne skupienie się na przystępności cenowej, mające na celu przyciągnięcie klientów korporacyjnych odkrywających zaawansowane narzędzia AI do procesów biznesowych i analiz.
Redukując koszty, Alibaba stara się pozycjonować swoją ofertę sztucznej inteligencji jako niezbędne narzędzia dla firm radzących sobie ze złożonymi kwestiami przyjęcia sztucznej inteligencji. Rozliczenia oparte na tokenach, które pobierają od użytkowników opłaty za określone interakcje ze sztuczną inteligencją, stały się centralnym elementem strategii cenowych, umożliwiając skalowalny dostęp do wydajnych modeli bez wygórowanych inwestycji z góry.
Rozwój multimodalnej sztucznej inteligencji za pomocą QVQ-72B
Rozwój multimodalnej sztucznej inteligencji za pomocą QVQ-72B
Na początku tego tygodnia Alibaba wprowadziła QVQ-72B, wielomodalny model sztucznej inteligencji typu open source, który integruje możliwości wnioskowania wizualnego i tekstowego. To wydanie opiera się na swoim poprzedniku, Qwen2-VL-72B, zwiększając funkcjonalność badań naukowych i zaawansowanych analiz.
Testy porównawcze potwierdziły możliwości QVQ-72B, a model uzyskał wynik 70,3 w teście MMMU— test mający na celu ocenę rozumowania multimodalnego na poziomie uniwersyteckim oraz doskonałe wyniki w programach MathVista i OlympiadBench. Wyniki te plasują QVQ-72B wśród najbardziej konkurencyjnych modeli open source w branży.
QwQ-32B: model precyzji logicznej
W listopadzie Alibaba wprowadziła QwQ-32B, model dostosowany do logicznego rozumowania, kodowania i zaawansowanych zadań matematycznych. Funkcja obliczeń w czasie testu przydziela dodatkowe zasoby obliczeniowe podczas wykonywania, poprawiając dokładność w przypadku złożonych problemów. Chociaż spowalnia to czas reakcji, precyzja oferowana przez QwQ-32B została doceniona w testach porównawczych i aplikacjach dla przedsiębiorstw.
Wydanie QwQ-32B na licencji Apache 2.0 odzwierciedla zaangażowanie Alibaba w równoważenie współpracy i kontroli własności.. Koncentrując się na sztucznej inteligencji skoncentrowanej na rozumowaniu, Alibaba bezpośrednio konkuruje z modelami takimi jak R1-Lite-Preview DeepSeek i model o1 OpenAI, w których priorytetem jest głębia logiczna i iteracyjne rozwiązywanie problemów.
Chiński sektor generatywnej sztucznej inteligencji był świadkiem tego szybki wzrost liczby modeli – tylko w 2024 r. ponad 250 ofert zostało zatwierdzonych do użytku publicznego. To nasycenie spowodowało intensywną konkurencję między liderami branży i start-upami, z których każdy walczy o wyróżnienie się poprzez cenę i unikalne cechy technologiczne.
Na przykład firma DeepSeek położyła nacisk na przejrzystość w swoim modelu R1-Lite-Preview, który wykorzystuje rozumowanie oparte na łańcuchu myślowym, aby podzielić problemy na etapy, umożliwiając użytkownikom śledzenie procesu decyzyjnego. Tymczasem ByteDance i Alibaba skupiają się na przystępności cenowej, aby zwiększyć adopcję na coraz bardziej zatłoczonym rynku.