Ezen a héten az Alibaba QWEN csapata kiadott egy új zászlóshajó nyílt forráskódú érvelési modelljét, amely felrázza az AI-iparot. A július 25-én bemutatott QWEN3-235B-A22B-Thinking-2507 modell már tetején volt a legfontosabb iparági referenciaértékek, amelyek felülmúlják a riválisok, mint például a Google és az Openai nagy hatalmas védett rendszereit. Elhagyja a korábbi „hibrid gondolkodás” megközelítését, hogy külön, speciális modelleket képezzen a komplex érvelés és a gyors oktatás követése érdekében. Ennek a lépésnek a célja, hogy magasabb minőséget biztosítson, és a fejlesztők számára a legmodernebb AI eszközöket biztosítsa. Teljesítménye nem korlátozódik egyetlen résre; Ehelyett egy jól lekerekített és erőteljes képességet mutat be a komplex érvelés, a kódolás és a felhasználói igazítás területén, és új szabványt állít be arra, amit az AI nyílt forrású AI elérhet. src=”adatok: image/svg+xml; nitro-üres-id=mtyzodoxmtc2-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mJ Aiihdpzhropsixmjgwiibozwlnahq9ijcymcygeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2z4=”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>

A fejlett matematikai és logikai érvelés területén a modell kivételesen képes. Az AIME25 referenciaértékén a kifinomult, többlépcsős problémamegoldó készségek kiértékelésére szolgáló teszt a QWEN3-Thinking-2507 figyelemre méltó pontszámot ért el 92,3-ban. Ez elé helyezi a legerősebb szabadalmaztatott modelleket, nevezetesen meghaladva a Google Gemini-2.5 Pro-t, amely ugyanazon értékelésnél 88,0 pontszámot tett közzé.

A modell bátorsága kiterjed a szoftverfejlesztés kritikus tartományába. Ha a Livecodebench V6-on tesztelték, egy olyan referenciaérték, amely felméri az AI képességét a valós kódolási feladatok kezelésére, a QWEN3-gondolkodás biztosítja a legmagasabb pontszámot 74,1. Ez az előadás kényelmesen elé állítja mind a Gemini-2.5 Pro (72,5), mind az Openai O4-Mini (71,8) elé, bemutatva a fejlesztők és a mérnöki csapatok gyakorlati hasznosságát. Ez az aréna-kemény V2 referenciaérték legfontosabb helyét vette igénybe, amely méri, hogy a felhasználók mely modelljei inkább a fej-fej összehasonlításában részesüljenek. Ez a 79,7-es vezető pontszám nemcsak az erős műszaki készségeket, hanem a nagyfokú hasznosságot, koherenciát és biztonságot is jelzi a generált válaszokban.

Ez a mérföldkőnek számító kiadás az Alibaba AI divíziójának egyik legfontosabb stratégiai forgót képvisel, amely szándékosan és gondosan megfontolva az evolúciót jelzi fejlesztési filozófiájában. A cég bejelentette, hogy hivatalosan elhagyja a „Hibrid gondolkodás” módot, amely korábbi QWEN3 modelljeinek alapvető jellemzője. Ez a kezdeti megközelítés megkövetelte a fejlesztőknek, hogy manuálisan válthassanak a gyors utasítások és a mély érvelési módok között, speciális tokenek segítségével, egy olyan rendszert, amely bonyolultságot és következetlenséget vezethet be. Egy hivatalos nyilatkozatban Alibaba felhő, amely a változás , a stating-t, a commising-t, és a Community the Community-t, és a Community the Community-t. Ami, úgy döntöttünk, hogy elhagyjuk a hibrid gondolkodási módot. Az „utasítás” modelleket finoman beállíthatjuk a közvetlen parancsok sebességére és hibátlan végrehajtására, míg a „gondolkodó” modellek kizárólag összetett, többlépcsős érvelési feladatokra képezhetők. Ez javítja a konzisztenciát, a fejlesztők nagyobb egyértelműségét, és végül az új kiadás által bemutatott kiváló referencia-teljesítmény. Míg a modell hatalmas 235 milliárd teljes paramétert tartalmaz, amely hatalmas tudás tárolóval rendelkezik, ez csak a sovány 22 milliárd paraméteres részhalmazt aktiválja az adott feladathoz.

A képességeinek továbbfejlesztése mellett a modell nagy 262 144-es kontextus ablakot kínál, amely jelentős növekedést jelent a korábbi verziókhoz képest, és kritikus jellemző a fejlett vállalati alkalmazások számára. Ez a hatalmas kapacitás lehetővé teszi a modell számára, hogy óriási mennyiségű információmennyiséget dolgozzon fel és érveljen egyetlen passzon, például a teljes szoftverkód-adattárak elemzése, a hosszú jogi vagy pénzügyi dokumentumok emésztése vagy a tökéletes visszahívás fenntartása a kiterjesztett, összetett felhasználói interakciók felett, anélkül, hogy a beszélgetés szálát elveszítené. A fejlesztők, a kiadás egyik legfontosabb szempontja az engedélyezése. A Qwen3-Thinking-2507 az Apache 2.0 licenc alatt elérhető , egy nagyon megengedő és kereskedelemben barátságos megállapodás. Ez lehetővé teszi a szervezetek számára, hogy szabadon letöltsék, módosítsák és telepítsék a modellt. Ez teljes ellenőrzést ad a vállalkozásoknak az adatvédelem, a biztonság, a költségek és a késleltetések felett, és foglalkozik a szabályozott iparágakban működő vállalkozások kulcsfontosságú aggályaival vagy érzékeny információkkal. A Az árazást 0,70 dollár/millió bemeneti token és egy millió dolláros kimenetet tokenseknél is beállítják. href=”https://openrouter.ai/models/qwen/qwen3-235b-a22b-thinking-2507″Target=”_ blank”> A modell elérése olyan platformokon keresztül, mint az OpenRouter . Ez kompatibilis az ügynökökkel, mint például a Qwen-agent , megkönnyítve az integrációt a komplex, automatizált munkafolyamatba, amely megköveteli a tervezést és az eszközhasználatot. Szemüveg

A QWEN3-gondolkodású modell a legújabb az Alibaba-ból származó gyors kibocsátások sorozatában. A QWEN csapata nemrégiben elindított egy új, hatalmas, 480B-os paraméterkóder modellt és egy többnyelvű fordítási modellt, amely átfogó nyílt forráskódú AI ökoszisztémát épített fel. Úgy tűnik, hogy a stratégia a teljes erőteljes, nyitott eszközök teljes készletének biztosítása a fejlesztők számára.

A kiadás ütemezése egyértelműen stratégiai volt. Csak egy nappal azelőtt jött, hogy az Alibaba megtekintette új „Quark AI” intelligens szemüvegét a mesterséges intelligencia világkonferenciáján Sanghajban. A szemüveget az új QWEN3 sorozat üzemelteti, egy olyan lépés, amelynek célja a hatalmas AI valós alkalmazásának bemutatása. Azáltal, hogy bebizonyította világszínvonalú AI képességeit, közvetlenül a hardver bemutatása előtt, az Alibaba végrehajtott egy „show, nem mondd el” stratégiát a piaci bizalom kiépítésére.

Categories: IT Info