Alibaba Cloud ha annunciato una riduzione del prezzo dell’85% per il suo modello di intelligenza artificiale con ragionamento visivo, Qwen-VL-Max. Il mossa si verifica mentre i giganti della tecnologia cinese, tra cui ByteDance e Baidu, combattono per il dominio nel settore dell’intelligenza artificiale aziendale in rapida crescita.
I prezzi ridotti, che posizionano Qwen-VL-Max a 0,003 yuan ($ 0,00041) per mille token, rispecchia la strategia aggressiva di ByteDance volta a ridurre i costi per i suoi modello di intelligenza artificiale per il ragionamento visivo lanciato all’inizio di dicembre.
La serie Qwen-VL di Alibaba comprende diversi altri modelli avanzati che integrano dati visivi e testuali per attività quali didascalie di immagini, risposte visive alle domande e generazione di contenuti multimodali. La formazione include Qwen-VL, Qwen-VL-Chat, Qwen2-VL e l’anteprima sperimentale QVQ-72B. Qwen2-VL, con le sue prestazioni all’avanguardia, ha eccelso in benchmark come MathVista e DocVQA, superando spesso concorrenti leader come GPT-4V di OpenAI e Gemini Ultra di Google.
Con oltre 252 modelli di intelligenza artificiale generativa approvati Quest’anno in Cina il mercato è diventato saturo, spingendo le aziende ad adottare strategie tecnologiche e di prezzo innovative per assicurarsi quote di mercato.
Prezzi strategici come modello coerente
L’annuncio di dicembre rappresenta il terzo importante aggiustamento dei prezzi dell’intelligenza artificiale di Alibaba nel 2024, dopo una riduzione del 55% a febbraio per i prodotti cloud core e uno sconto del 97% a maggio per la suite Qwen AI. Queste mosse riflettono un’attenzione costante all’accessibilità economica, con l’obiettivo di attrarre clienti aziendali che esplorano strumenti avanzati di intelligenza artificiale per processi e analisi aziendali.
Riducendo i costi, Alibaba cerca di posizionare le sue offerte di intelligenza artificiale come strumenti indispensabili per le aziende che affrontano le complessità di adottare l’intelligenza artificiale. La fatturazione basata su token, che addebita agli utenti specifiche interazioni con l’intelligenza artificiale, è diventata centrale nelle strategie di prezzo, consentendo un accesso scalabile a modelli potenti senza investimenti iniziali proibitivi.
Avanzamento dell’intelligenza artificiale multimodale con QVQ-72B
All’inizio di questa settimana, Alibaba ha introdotto QVQ-72B, un modello di intelligenza artificiale multimodale open source che integra capacità di ragionamento visivo e testuale. Questa versione si basa sul suo predecessore, Qwen2-VL-72B, migliorando le funzionalità per la ricerca scientifica e l’analisi avanzata.
I benchmark hanno convalidato le capacità di QVQ-72B, con il modello che ha ottenuto un punteggio di 70,3 sul benchmark MMMU— un test progettato per valutare il ragionamento multimodale a livello universitario e eccellere in MathVista e OlympiadBench. Questi risultati collocano QVQ-72B tra i modelli open source più competitivi del settore.
QwQ-32B: A Model for Logical Precision
A novembre , Alibaba ha introdotto QwQ-32B, un modello su misura per il ragionamento logico, la codifica e compiti matematici avanzati. La sua funzionalità di calcolo in fase di test alloca risorse computazionali aggiuntive durante l’esecuzione, migliorando la precisione per problemi complessi. Sebbene ciò rallenti i tempi di risposta, la precisione offerta da QwQ-32B è stata elogiata nei benchmark e nelle applicazioni aziendali.
Il rilascio di QwQ-32B con la licenza Apache 2.0 riflette l’impegno di Alibaba nel bilanciare collaborazione e controllo proprietario. Concentrandosi sull’intelligenza artificiale incentrata sul ragionamento, Alibaba compete direttamente con modelli come R1-Lite-Preview di DeepSeek e il modello o1 di OpenAI, che danno entrambi priorità alla profondità logica e alla risoluzione iterativa dei problemi.
Il settore dell’intelligenza artificiale generativa cinese è stato testimone una rapida proliferazione di modelli, con oltre 250 offerte approvate per l’uso pubblico solo nel 2024. Questa saturazione ha alimentato un’intensa competizione tra leader del settore e start-up, ciascuno in competizione per la differenziazione attraverso prezzi e caratteristiche tecnologiche uniche.
DeepSeek, ad esempio, ha enfatizzato la trasparenza con il suo modello R1-Lite-Preview, che utilizza il ragionamento basato sulla catena di pensiero per suddividere i problemi in passaggi incrementali, consentendo agli utenti di monitorare il proprio processo decisionale. Nel frattempo, ByteDance e Alibaba si concentrano sulla convenienza per favorire l’adozione in un mercato sempre più affollato.