Alibaba Cloud hat eine Preissenkung von 85 % für sein visuelles Argumentations-KI-Modell Qwen-VL-Max angekündigt. Der Qwen-VL-Max bei 0,003 Yuan (0,00041 USD) pro tausend Token spiegelt die aggressive Strategie von ByteDance wider, die Kosten für seine zu senken Das KI-Modell für visuelles Denken wurde Anfang Dezember eingeführt.
Die Qwen-VL-Serie von Alibaba umfasst mehrere andere erweiterte Modelle, die visuelle und textliche Daten für Aufgaben wie Bildunterschriften integrieren, visuelle Beantwortung von Fragen und multimodale Inhaltsgenerierung. Das Sortiment umfasst Qwen-VL, Qwen-VL-Chat, Qwen2-VL und das experimentelle QVQ-72B-Preview. Qwen2-VL hat sich mit seiner hochmodernen Leistung in Benchmarks wie MathVista und DocVQA hervorgetan und oft führende Konkurrenten wie OpenAIs GPT-4V und Googles Gemini Ultra übertroffen.
Mit über 252 Aufgrund der in diesem Jahr in China genehmigten generativen KI-Modelle ist der Markt gesättigt, was Unternehmen dazu veranlasst, innovative Preis-und Technologiestrategien einzuführen, um sich Marktanteile zu sichern.
Strategische Preisgestaltung als konsistentes Muster
Die Ankündigung im Dezember ist Alibabas dritte große KI-Preisanpassung im Jahr 2024, nach einer Reduzierung um 55 % im Februar für Kern-Cloud-Produkte und einem Rabatt von 97 % im Mai für die Qwen-KI-Suite. Diese Schritte spiegeln einen konsequenten Fokus auf Erschwinglichkeit wider und zielen darauf ab, Unternehmenskunden zu gewinnen, die fortschrittliche KI-Tools für Geschäftsprozesse und Analysen erkunden möchten.
Durch Kostensenkungen möchte Alibaba seine KI-Angebote als unverzichtbare Werkzeuge für Unternehmen positionieren, die sich mit der Komplexität auseinandersetzen müssen der Einführung künstlicher Intelligenz. Die tokenbasierte Abrechnung, bei der Benutzern bestimmte KI-Interaktionen in Rechnung gestellt werden, ist zu einem zentralen Bestandteil von Preisstrategien geworden und ermöglicht einen skalierbaren Zugriff auf leistungsstarke Modelle ohne übermäßige Vorabinvestitionen.
Förderung der multimodalen KI mit QVQ-72B
Anfang dieser Woche stellte Alibaba QVQ-72B vor, ein multimodales Open-Source-KI-Modell, das visuelle und textuelle Denkfähigkeiten integriert. Diese Version baut auf seinem Vorgänger Qwen2-VL-72B auf und erweitert die Funktionalität für wissenschaftliche Forschung und fortgeschrittene Analysen.
Benchmarks haben die Fähigkeiten von QVQ-72B validiert, wobei das Modell im MMMU-Benchmark eine Punktzahl von 70,3 erreichte – ein Test zur Bewertung des multimodalen Denkens auf Universitätsniveau – und hervorragende Leistungen in MathVista und OlympiadBench. Diese Ergebnisse machen QVQ-72B zu einem der wettbewerbsfähigsten Open-Source-Modelle der Branche.
QwQ-32B: Ein Modell für logische Präzision
Im November , Alibaba stellte QwQ-32B vor, ein Modell, das auf logisches Denken, Codierung und fortgeschrittene mathematische Aufgaben zugeschnitten ist. Seine Testzeit-Rechenfunktion weist während der Ausführung zusätzliche Rechenressourcen zu und verbessert so die Genauigkeit bei komplexen Problemen. Während sich dadurch die Reaktionszeiten verlangsamen, wurde die Präzision, die QwQ-32B bietet, in Benchmarks und Unternehmensanwendungen gelobt.
Die Veröffentlichung von QwQ-32B unter der Apache 2.0-Lizenz spiegelt Alibabas Engagement für die Balance zwischen Zusammenarbeit und proprietärer Kontrolle wider. Durch die Konzentration auf argumentationszentrierte KI konkurriert Alibaba direkt mit Modellen wie dem R1-Lite-Preview von DeepSeek und dem o1-Modell von OpenAI, die beide Priorität auf logische Tiefe und iterative Problemlösung legen.
Chinas generative KI-Branche hat dies erlebt eine rasante Verbreitung von Modellen, wobei allein im Jahr 2024 über 250 Angebote für die öffentliche Nutzung zugelassen wurden. Diese Sättigung hat zu einem intensiven Wettbewerb zwischen Branchenführern und Start-ups geführt, die jeweils um Differenzierung durch Preise und einzigartige technologische Funktionen wetteifern.
DeepSeek hat beispielsweise mit seinem R1-Lite-Preview-Modell den Schwerpunkt auf Transparenz gelegt nutzt die Gedankenkette, um Probleme in inkrementelle Schritte zu unterteilen, sodass Benutzer den Entscheidungsprozess verfolgen können. Unterdessen konzentrieren sich ByteDance und Alibaba auf Erschwinglichkeit, um die Akzeptanz in einem zunehmend überfüllten Markt voranzutreiben.