Alibaba Cloud har annonsert en prisreduksjon på 85 % for sin visuelle AI-modell, Qwen-VL-Max. move kommer når kinesiske teknologigiganter, inkludert ByteDance og Baidu, kjemper om dominans i den raskt voksende AI-sektoren for bedrifter.

Den reduserte prissetting, som plasserer Qwen-VL-Max til 0,003 yuan ($0,00041) per tusen tokens, gjenspeiler ByteDances aggressive strategi for å redusere kostnadene for sin visuelle AI-modell som ble lansert tidligere i desember.

Alibabas Qwen-VL-serie omfatter flere andre avanserte modeller som integrerer visuelle og tekstdata for oppgaver som bildeteksting, visuelt svar på spørsmål og generering av multimodalt innhold. Oppstillingen inkluderer Qwen-VL, Qwen-VL-Chat, Qwen2-VL og den eksperimentelle QVQ-72B-Preview. Qwen2-VL, med sin toppmoderne ytelse, har utmerket seg i benchmarks som MathVista og DocVQA, og har ofte overgått ledende konkurrenter som OpenAIs GPT-4V og Googles Gemini Ultra.

Med over 252 generative AI-modeller godkjent i Kina i år, har markedet vokst seg mettet, noe som har fått selskaper til å ta i bruk innovative pris-og teknologistrategier for å sikre markedsandeler.

Strategisk prising som et konsistent mønster

Desemberkunngjøringen er Alibabas tredje store AI-prisjustering i 2024, etter en reduksjon på 55 % i februar for kjerneskyprodukter og 97 % rabatt i mai for Qwen AI-pakken. Disse grepene reflekterer et konsekvent fokus på rimelig pris, med sikte på å tiltrekke bedriftskunder som utforsker avanserte AI-verktøy for forretningsprosesser og analyser.

Ved å redusere kostnadene søker Alibaba å posisjonere sine AI-tilbud som uunnværlige verktøy for selskaper som navigerer i kompleksiteten å ta i bruk kunstig intelligens. Tokenbasert fakturering, som belaster brukere for spesifikke AI-interaksjoner, har blitt sentral i prisstrategier, og muliggjør skalerbar tilgang til kraftige modeller uten uoverkommelige forhåndsinvesteringer.

Avansere multimodal AI med QVQ-72B

strong>

Tidligere denne uken introduserte Alibaba QVQ-72B, en åpen kildekode multimodal AI-modell som integrerer visuelle og tekstlige resonneringsevner. Denne utgivelsen bygger på forgjengeren Qwen2-VL-72B, og forbedrer funksjonaliteten for vitenskapelig forskning og avansert analyse.

Referansemål har validert QVQ-72Bs evner, med modellen som oppnår en poengsum på 70,3 på MMMU-referansen— en test designet for å evaluere multimodal resonnement på universitetsnivå-og utmerke seg i MathVista og OlympiadBench. Disse resultatene plasserer QVQ-72B blant de mest konkurransedyktige open source-modellene i bransjen.

QwQ-32B: A Model for Logical Precision

I november , introduserte Alibaba QwQ-32B, en modell skreddersydd for logisk resonnement, koding og avanserte matematiske oppgaver. Dens test-tidsberegningsfunksjon tildeler ekstra beregningsressurser under utførelse, og forbedrer nøyaktigheten for komplekse problemer. Selv om dette reduserer responstidene, har presisjonen som tilbys av QwQ-32B blitt berømmet i benchmarks og bedriftsapplikasjoner.

Utgivelsen av QwQ-32B under Apache 2.0-lisensen reflekterer Alibabas forpliktelse til å balansere samarbeid og proprietær kontroll. Ved å fokusere på resonnementsentrisk AI, konkurrerer Alibaba direkte med modeller som DeepSeeks R1-Lite-Preview og OpenAIs o1-modell, som begge prioriterer logisk dybde og iterativ problemløsning.

Kinas generative AI-sektor har vært vitne til. en rask spredning av modeller, med over 250 tilbud godkjent for offentlig bruk i 2024 alene. Denne metningen har ført til intens konkurranse blant industriledere og nystartede bedrifter, som hver kjemper om differensiering gjennom priser og unike teknologiske funksjoner.

DeepSeek, for eksempel, har lagt vekt på åpenhet med sin R1-Lite-Preview-modell, som bruker tankekjede-resonnement for å dele opp problemer i trinnvise trinn, slik at brukerne kan spore beslutningsprosessen. I mellomtiden fokuserer ByteDance og Alibaba på rimelighet for å drive adopsjon i et stadig mer overfylt marked.

Categories: IT Info