Alibaba Cloud har meddelat en prissänkning på 85 % för sin visuella AI-modell, Qwen-VL-Max. move kommer när kinesiska teknikjättar, inklusive ByteDance och Baidu, slåss om dominans i den snabbt växande företags-AI-sektorn.
Den minskade prissättning, som placerar Qwen-VL-Max till 0,003 yuan (0,00041 USD) per tusen tokens, speglar ByteDances aggressiva strategi för att sänka kostnaderna för sin visuella AI-modell som lanserades tidigare i december.
Alibabas Qwen-VL-serie omfattar flera andra avancerade modeller som integrerar visuell och textdata för uppgifter som bildtextning, visuellt svar på frågor och generering av multimodalt innehåll. Serien inkluderar Qwen-VL, Qwen-VL-Chat, Qwen2-VL och den experimentella QVQ-72B-Preview. Qwen2-VL, med sin toppmoderna prestanda, har utmärkt sig i benchmarks som MathVista och DocVQA, ofta överträffat ledande konkurrenter som OpenAI:s GPT-4V och Googles Gemini Ultra.
Med över 252 generativa AI-modeller som godkänts i Kina i år, dess marknad har blivit mättad, vilket har fått företag att anta innovativa prissättnings-och teknikstrategier för att säkra marknadsandelar.
Strategisk prissättning som ett konsekvent mönster >
Decembermeddelandet är Alibabas tredje stora AI-prisjustering 2024, efter en sänkning på 55 % i februari för kärnmolnprodukter och 97 % rabatt i maj för Qwen AI-sviten. Dessa åtgärder återspeglar ett konsekvent fokus på överkomliga priser, som syftar till att locka företagskunder som utforskar avancerade AI-verktyg för affärsprocesser och analyser.
Genom att minska kostnaderna försöker Alibaba att positionera sina AI-erbjudanden som oumbärliga verktyg för företag som navigerar i komplexiteten. att anta artificiell intelligens. Tokenbaserad fakturering, som debiterar användare för specifika AI-interaktioner, har blivit central för prissättningsstrategier, vilket möjliggör skalbar tillgång till kraftfulla modeller utan oöverkomliga förhandsinvesteringar.
Avancera multimodal AI med QVQ-72B
strong>
Tidigare i veckan introducerade Alibaba QVQ-72B, en multimodal AI-modell med öppen källkod som integrerar visuella och textmässiga resonemangsförmåga. Den här utgåvan bygger på sin föregångare, Qwen2-VL-72B, och förbättrar funktionaliteten för vetenskaplig forskning och avancerad analys.
Benchmarks har validerat QVQ-72B:s kapacitet, med modellen som uppnår ett betyg på 70,3 på MMMU-riktmärket— ett test utformat för att utvärdera multimodala resonemang på universitetsnivå – och att utmärka sig i MathVista och OlympiadBench. Dessa resultat placerar QVQ-72B bland de mest konkurrenskraftiga modellerna med öppen källkod i branschen.
QwQ-32B: A Model for Logical Precision
I november , introducerade Alibaba QwQ-32B, en modell skräddarsydd för logiska resonemang, kodning och avancerade matematiska uppgifter. Dess test-tidsberäkningsfunktion allokerar ytterligare beräkningsresurser under exekvering, vilket förbättrar noggrannheten för komplexa problem. Även om detta saktar ner svarstiderna, har precisionen som erbjuds av QwQ-32B hyllats i benchmarks och företagsapplikationer.
Släppningen av QwQ-32B under Apache 2.0-licensen återspeglar Alibabas engagemang för att balansera samarbete och egen kontroll. Genom att fokusera på resonemangscentrerad AI konkurrerar Alibaba direkt med modeller som DeepSeeks R1-Lite-Preview och OpenAI:s o1-modell, som båda prioriterar logiskt djup och iterativ problemlösning.
Kinas generativa AI-sektor har bevittnats. en snabb spridning av modeller, med över 250 erbjudanden godkända för allmänt bruk bara under 2024. Denna mättnad har underblåst intensiv konkurrens bland branschledare och nystartade företag, som var och en tävlar om differentiering genom prissättning och unika tekniska funktioner.
DeepSeek, till exempel, har betonat transparens med sin R1-Lite-Preview-modell, som använder tankekedja för att dela upp problem i stegvisa steg, vilket gör det möjligt för användare att spåra deras beslutsprocess. Samtidigt fokuserar ByteDance och Alibaba på överkomliga priser för att driva adoption på en alltmer trång marknad.