Noul model de raționament QWEN3 al Alibaba se ridică la OpenAI și Google Benchmarks în lansarea majoră a surselor open-source

săptămâna aceasta, echipa Qwen a Alibaba a lansat un nou model de raționament open-source, care agită industria AI. Dezvăluit pe 25 iulie, modelul QWEN3-235B-A22B-Thinking-2507 a depășit deja reperele cheie ale industriei, depășind sisteme proprii puternice de la rivali precum Google și OpenAI.

Lansarea marchează o schimbare strategică semnificativă pentru gigantul tehnic chinezesc. Abandonarea abordării sale anterioare de „gândire hibridă” pentru a antrena modele separate și specializate pentru raționamente complexe și instrucțiuni rapide. This move aims to deliver higher quality and provide developers with state-of-the-art AI tools.

A New Open-Source King: Qwen3-Thinking Tops the Benchmark Charts

The new Qwen3-Thinking model delivers state-of-the-art results across a suite of demanding industry benchmarks, directly challenging the dominance of established, closed-source sisteme. Performanța sa nu se limitează la o singură nișă; În schimb, demonstrează o capacitate bine rotunjită și puternică în raționamentele complexe, codificarea și alinierea utilizatorilor, setarea unui nou standard pentru ceea ce poate obține AI open-source.

În domeniul raționamentului matematic și logic avansat, modelul s-a dovedit a fi excepțional de capabil. Pe referința AIME25, un test conceput pentru a evalua abilitățile sofisticate, în mai multe etape, de rezolvare a problemelor, QWEN3-Thinking-2507 a obținut un scor remarcabil de 92,3. Acest lucru îl plasează înaintea unora dintre cele mai puternice modele proprii, depășind în special GEMINII-2.5 Pro, care a înregistrat un scor de 88.0 pe aceeași evaluare.

Proba modelului se extinde în domeniul critic al dezvoltării software. Când a fost testat pe LiveCodeBench V6, un referință care evaluează capacitatea AI de a gestiona sarcinile de codificare din lumea reală, gândirea QWEN3 a obținut un scor de 74.1. Această performanță o pune confortabil atât înaintea Gemini-2.5 Pro (72.5), cât și a O4-MINI (71.8), demonstrând utilitatea sa practică pentru dezvoltatori și echipe de inginerie.

dincolo de inteligența brută și abilitatea de codare, modelul excelează și în alinierea umană și în preferința subiectivă. A luat primul loc pe referința de referință V2 arena, care măsoară modelul utilizatorilor preferă în comparații din cap. Acest scor principal de 79,7 indică nu doar o abilitate tehnică puternică, ci și un grad ridicat de utilitate, coerență și siguranță în răspunsurile sale generate.

Capacitățile modelului semnalează un moment pivot în care alternativele open-source nu mai sunt doar prinzând, ci acum concurează direct la frontieră de raționament Hybrid.

Această eliberare de reper reprezintă un pivot strategic major pentru divizia AI a Alibaba, semnalând o evoluție deliberată și considerată cu atenție în filozofia sa de dezvoltare. Compania a anunțat că abandonează oficial modul „Hybrid Thinking”, care a fost o caracteristică de bază a modelelor sale anterioare QWEN3. Acea abordare inițială a impus dezvoltatorilor să se comporte manual între moduri rapide de urmărire a instrucțiunilor și de raționament profund folosind jetoane speciale, un sistem care ar putea introduce complexitate și inconsecvență.

Decizia de a se îndepărta de această arhitectură hibridă a fost determinată de un angajament pentru calitate și feedback direct din partea comunității pentru dezvoltatori. Într-o declarație oficială, Alibaba Cloud a explicat schimbarea , state, după ce discută cu comunitatea și a reflectat schimbarea

Subpinning Noul model de gândire este o arhitectură sofisticată și extrem de eficientă a amestecului de experți (MOE). While the model contains a massive 235 billion total parameters, providing it with an immense repository of knowledge, it only activates a lean 22-billion-parameter subset for any given task.

This design, which reportedly involves selecting 8 out of 128 available “experts”per query, provides the power of a frontier-scale model while maintaining the computational efficiency and lower inference costs typically associated with much smaller Modele.

Îmbunătățirea în continuare a capacităților sale, modelul oferă o fereastră mare de context de 262.144-token, care reprezintă o creștere semnificativă față de versiunile anterioare și este o caracteristică critică pentru aplicațiile avansate pentru întreprinderi. Această capacitate vastă permite modelului să se proceseze și să raționeze asupra unor cantități enorme de informații într-o singură trecere, cum ar fi analiza întregurilor depozite de cod software, digerarea documentelor legale sau financiare îndelungate sau menținerea rechemării perfecte asupra interacțiunilor de utilizator complexe, fără a pierde firul conversației.

o putere pregătită pentru întreprinderi cu liders, de comunicare, de liders,

pentru a intra în lider și de liders, de comunicare,

Dintre cele mai semnificative aspecte ale lansării este licențiarea acesteia. QWEN3-CHINKING-2507 este Disponibil sub licența Apache 2.0 , un acord extrem de permisiv și prietenos. Acest lucru permite organizațiilor să descarce, să modifice și să implementeze în mod liber modelul.

Această abordare deschisă este în contrast puternic cu modelele API-gated de la concurenți. Oferă întreprinderilor un control complet asupra confidențialității, securității, costurilor și latenței datelor lor, abordând problemele cheie pentru întreprinderile care operează în industrii reglementate sau cu informații sensibile.

Modelul este disponibil pentru descărcare pe Hugging Face și poate fi accesat prin API. Prețul este stabilit la 0,70 USD pe milion de tokne de intrare și 8,40 USD la milion de jetoane de ieșire , cu un nivel liber pentru dezvoltatori pentru experimentare. Accesați modelul prin platforme precum Openrouter . Este compatibil cu cadre agentice, cum ar fi Qwen-Agent , facilitând integrarea în fluxuri de lucru complexe, automatizate, care necesită planificare și utilizarea instrumentului.

Ochelarii

Modelul de gândire QWEN3 este cel mai recent dintr-o succesiune rapidă de versiuni de la Alibaba. Echipa QWEN a lansat recent, de asemenea, un nou model masiv de codificator de 480B-parametri și un model de traducere multilingvă, construind un ecosistem AI open-source cuprinzător. Strategia pare a fi una de a oferi o suită completă de instrumente puternice și deschise pentru dezvoltatori.

Momentul acestei versiuni a fost clar strategic. A venit cu doar o zi înainte ca Alibaba să prevină noile sale ochelari inteligenți „Quark AI” la Conferința Mondială de Inteligență Artificială de la Shanghai. Ochelarii sunt alimentați de noua serie QWEN3, o mișcare concepută pentru a prezenta aplicarea din lumea reală a puternicii sale AI.

Gang Song din grupul inteligent de afaceri al Alibaba a împărtășit viziunea sa pentru tehnologie, afirmând că „Ochelari AI va deveni cea mai importantă formă de inteligență purtabilă-va servi ca o altă pereche de ochi și urechi pentru oameni”. Prin dovedirea capacităților sale de AI de clasă mondială chiar înainte de a dezvălui hardware-ul, Alibaba a executat o strategie „Show, nu spuneți” pentru a construi încrederea pieței.

Această abordare integrată de hardware și software poziționează Alibaba pentru a concura doar pe performanța modelului, ci și pe crearea unei experiențe de utilizator fără sud

Noul model de raționament QWEN3 al Alibaba se ridică la OpenAI și Google Benchmarks în lansarea majoră a surselor open-source

Published by All Things Windows on July 27, 2025

A New Open-Source King: Qwen3-Thinking Tops the Benchmark Charts

o putere pregătită pentru întreprinderi cu liders, de comunicare, de liders,

Ochelarii

IT Info

Windows 11 Insider Preview Build 27909 (Canary Channel) aduce corecții și îmbunătățiri

IT Info

Microsoft susține Windows 11 24H2 BSOD și Windows Probleme Firewall sunt rezolvate

IT Info

Cum se modifică poziția indicatorului pe ecran în Windows 11

Noul model de raționament QWEN3 al Alibaba se ridică la OpenAI și Google Benchmarks în lansarea majoră a surselor open-source

Published by All Things Windows on July 27, 2025

A New Open-Source King: Qwen3-Thinking Tops the Benchmark Charts

o putere pregătită pentru întreprinderi cu liders, de comunicare, de liders,

Ochelarii

Related Posts

IT Info

Windows 11 Insider Preview Build 27909 (Canary Channel) aduce corecții și îmbunătățiri

IT Info

Microsoft susține Windows 11 24H2 BSOD și Windows Probleme Firewall sunt rezolvate

IT Info

Cum se modifică poziția indicatorului pe ecran în Windows 11