Questa settimana, il team Qwen di Alibaba ha rilasciato un nuovo modello di ragionamento open source di punta che sta scuotendo l’industria dell’intelligenza artificiale. Presentato il 25 luglio, il modello QWEN3-235B-A22B-Thinking-2507 ha già superato i parametri di riferimento dell’industria chiave, sovraperformando potenti sistemi proprietari da rivali come Google e Openai.
Il lancio segna uno spostamento strategico significativo per il gigante tecnologico cinese. Sta abbandonando il suo precedente approccio”pensiero ibrido”per addestrare modelli separati e specializzati per ragionamenti complessi e seguire le istruzioni veloci. Questa mossa mira a offrire una qualità superiore e fornire agli sviluppatori strumenti di intelligenza artificiale all’avanguardia.
Un nuovo re open source: il pensiero di Qwen3 è in cima alle classifiche di riferimento
Il nuovo modello di riflessione di Qwen3. La sua performance non è limitata a una singola nicchia; Invece, dimostra una capacità a tutto tondo e potente in ragionamento, codifica e allineamento degli utenti complessi, impostando un nuovo standard per ciò che AI Open-Source può ottenere.
Nel regno del ragionamento matematico e logico avanzato, il modello ha dimostrato di essere eccezionalmente capace. Sul benchmark AIME25, un test progettato per valutare sofisticate capacità di risoluzione dei problemi a più fasi, Qwen3-Phinking-2507 ha ottenuto un punteggio notevole di 92,3. Questo lo pone davanti ad alcuni dei modelli proprietari più potenti, in particolare superando Gemini-2.5 Pro di Google, che ha pubblicato un punteggio di 88,0 sulla stessa valutazione.
L’abilità del modello si estende nel dominio critico dello sviluppo del software. Se testato su LiveCodebench V6, un punto di riferimento che valuta la capacità di un’intelligenza artificiale di gestire le attività di codifica del mondo reale, il pensiero Qwen3 ha ottenuto un punteggio migliore di 74,1. Questa performance lo pone comodamente davanti a Gemini-2.5 Pro (72.5) e O4-Mini di Openi (71.8), dimostrando la sua utilità pratica per gli sviluppatori e i team di ingegneria. Ha preso il primo posto sul benchmark V2-hard Arena, che misura che i modelli degli utenti preferiscono nei confronti testa a testa. Questo punteggio principale di 79,7 indica non solo una forte abilità tecnica, ma anche un alto grado di utilità, coerenza e sicurezza nelle sue risposte generate.
Le capacità del modello segnalano un momento fondamentale in cui le alternative open-source non sono più recuperate ma ora sono direttamente in competizione alla resi di frontiera della AI. Ragionamento
Questo rilascio di riferimento rappresenta un importante perno strategico per la divisione AI di Alibaba, segnalando un’evoluzione deliberata e attentamente considerata nella sua filosofia di sviluppo. La società ha annunciato che sta abbandonando ufficialmente la modalità”pensiero ibrido”che era una caratteristica fondamentale dei suoi precedenti modelli Qwen3. Tale approccio iniziale ha richiesto agli sviluppatori di alternare manualmente tra modalità rapide che seguono le istruzioni e profonde che utilizzavano token speciali, un sistema in grado di introdurre complessità e incoerenza.
La decisione di allontanarsi da questa architettura ibrida è stata guidata da un impegno per la qualità e il feedback diretto della comunità degli sviluppatori. In una dichiarazione formale, alibaba cloud ha esplicito il cloud
alla base del nuovo modello di pensiero è un’architettura di miscele di esperti sofisticati e altamente efficienti (MOE). Mentre il modello contiene un enorme parametri totali di 235 miliardi di 235 miliardi, fornendogli un immenso deposito di conoscenza, attiva solo un sottoinsieme di parametri di 22 miliardi di 2 miliardi per qualsiasi compito.
Questo progetto, che secondo quanto riferito, prevede la selezione di molteplici infazioni con molta inferenza.
Migliora ulteriormente le sue capacità, il modello offre una grande finestra di contesto di 262.144-tek, che rappresenta un aumento significativo rispetto alle versioni precedenti ed è una caratteristica fondamentale per applicazioni aziendali avanzate. Questa vasta capacità consente al modello di elaborare e ragionare su enormi quantità di informazioni in un unico passaggio, come l’analisi di interi repository di codice software, digerire lunghi documenti legali o finanziari o mantenere un perfetto richiamo su interazioni estese e complesse senza perdere le dirigenti e per i dirigenti. Degli aspetti più significativi del rilascio sono le sue licenze. Qwen3-Thinking-257 è disponibile ai sensi della licenza Apache 2.0 , un accordo altamente permissibile e commerciale. Ciò consente alle organizzazioni di scaricare, modificare e distribuire liberamente il modello.
Questo approccio aperto si erge in netto contrasto con i modelli con concorrenza API-gated. Offre alle aziende il pieno controllo sulla privacy dei dati, sulla sicurezza, sui costi e sulla latenza, affrontando le preoccupazioni chiave per le aziende che operano in settori regolamentati o con informazioni sensibili.
Il modello è disponibile per il download su abbracci e è possibile accedere tramite API. Il Il prezzo è impostato a $ 0,70 per milione di token di input e $ 8,40 per milione di token di uscita , con una manciata libera da sperimentare accedi al modello attraverso piattaforme come OpenRouter . È compatibile con framework agenti come Qwen-agent , facilitando l’integrazione al complesso, flussi di lavoro automatizzati che richiedono una pianificazione e un utilizzo degli strumenti. il QWEN più ampio: il codice eco Occhiali
Il modello di pensiero Qwen3 è l’ultimo in una rapida successione di versioni da Alibaba. Il team di Qwen ha anche recentemente lanciato un nuovo modello di codificatore di parametri da 480B e un modello di traduzione multilingue, che costruisce un ecosistema di intelligenza artificiale aperto completo. La strategia sembra essere quella di fornire una suite completa di strumenti potenti e aperti per gli sviluppatori.
Il tempismo di questa versione era chiaramente strategico. È arrivato solo un giorno prima che Alibaba prevedesse i suoi nuovi occhiali intelligenti”Quark AI”al World Artificial Intelligence Conference a Shanghai. Gli occhiali sono alimentati dalla nuova serie QWEN3, una mossa progettata per mostrare l’applicazione del mondo reale della sua potente AI.
Gang di canzoni di Alibaba Information Business Group ha condiviso la sua visione per la tecnologia, affermando:”Gli occhiali AI diventeranno la forma più importante di intelligenza indossabile-servirà da altri due occhi e orecchie per gli umani”. Dimostrando le sue funzionalità di intelligenza artificiale di livello mondiale poco prima di svelare l’hardware, Alibaba ha eseguito uno”spettacolo, non raccontare”Strategia per costruire la fiducia del mercato.
Questo approccio hardware e software integrato posiziona Alibaba per competere non solo sulle prestazioni del modello, ma sulla creazione di un’esperienza utente senza soluzione di continuità all’interno del suo vasto ecosistema di servizi, da e-commerce.