Modeli i ri i Arsyetimit të Alibaba Tops Openai dhe Google Benchmarks në Release Major Source Open

Këtë javë, ekipi Qwen i Alibaba ka lëshuar një model të ri të arsyetimit me burim të hapur me burim të hapur që po shtrëngon industrinë e AI. I zbuluar në 25 korrik, modeli QWEN3-235B-A22B-duke-ndjerë-2507 ka kryesuar standardet kryesore të industrisë, duke tejkaluar sistemet e fuqishme të pronarit nga rivalët si Google dhe Openai. Po braktis qasjen e saj të mëparshme”të menduarit hibrid”për të trajnuar modele të ndara, të specializuara për arsyetim kompleks dhe ndjekje të shpejtë të udhëzimeve. Kjo veprim synon të sigurojë cilësi më të lartë dhe t’u sigurojë zhvilluesve mjete më të mira të AI. Performanca e saj nuk kufizohet në një kamare të vetme; Në vend të kësaj, ajo demonstron një aftësi të rrumbullakosur mirë dhe të fuqishme në arsyetimin, kodimin dhe shtrirjen e përdoruesit komplekse, duke vendosur një standard të ri për atë që mund të arrijë AI me burim të hapur. src=”të dhëna: imazh/svg+xml; nitro-impty-id=mtyzodoxmtc2-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mj AiiHdpZHropsixmjgwiibozwlnahq9iJCymcigEg1Sbnm9imH0dha6ly93d3cudzmUB3JnlziWmdavc3znij48l3n2zz4=”>

Në fushën e arsyetimit të përparuar matematikor dhe logjik, modeli ka provuar të jetë jashtëzakonisht i aftë. Në standardin AIME25, një test i krijuar për të vlerësuar aftësitë e sofistikuara, me shumë hapa për zgjidhjen e problemeve, QWEN3-mendimi-2507 arriti një rezultat të jashtëzakonshëm prej 92.3. Kjo e vendos atë përpara disa prej modeleve më të fuqishme të pronarit, veçanërisht duke tejkaluar Gemini-2.5 Pro të Google, i cili postoi një rezultat prej 88.0 në të njëjtin vlerësim.

aftësia e modelit shtrihet në fushën kritike të zhvillimit të softuerit. Kur testohet në LiveCodeBench V6, një pikë referimi që vlerëson aftësinë e një AI për të trajtuar detyrat e kodimit të botës reale, mendimi QWEN3 siguroi një rezultat të lartë prej 74.1. Kjo performancë e vendos atë të qetë përpara të dy Gemini-2.5 Pro (72.5) dhe Openai’s O4-Mini (71.8), duke demonstruar shërbimet e tij praktike për zhvilluesit dhe ekipet inxhinierike. Ai mori vendin e parë në standardin e Arena-Hard V2, i cili masat që përdoruesit e modelit preferojnë në krahasime kokë më kokë. Kjo rezultat kryesor prej 79.7 tregon jo vetëm aftësi teknike të fortë, por edhe një shkallë të lartë të dobisë, koherencës dhe sigurisë në përgjigjet e saj të krijuara.

Kjo lëshim historik paraqet një qendër kryesore strategjike për ndarjen AI të Alibaba, duke sinjalizuar një evolucion të qëllimshëm dhe të konsideruar me kujdes në filozofinë e tij të zhvillimit. Kompania njoftoi se po braktis zyrtarisht modalitetin”të menduarit hibrid”që ishte një tipar thelbësor i modeleve të saj të mëparshme QWEN3. Kjo qasje fillestare kërkonte që zhvilluesit të ndryshojnë manualisht midis mënyrave të shpejta të ndjekjes së udhëzimeve dhe arsyetimit të thellë duke përdorur shenja të veçanta, një sistem që mund të prezantojë kompleksitetin dhe mospërputhjen. Në një deklaratë zyrtare, Përmirësimi i mëtejshëm i aftësive të tij, modeli ofron një dritare të madhe të kontekstit të kontrollit 262,144, e cila paraqet një rritje të konsiderueshme nga versionet e mëparshme dhe është një veçori kritike për aplikimet e avancuara të ndërmarrjeve. Ky kapacitet i gjerë lejon që modeli të përpunojë dhe arsyetojë mbi sasi të mëdha të informacionit në një kalim të vetëm, siç është analizimi i të gjithë rePozitave të kodit të softuerit, tretja e dokumenteve të gjata ligjore ose financiare, ose mbajtja e kujtimit perfekt mbi ndërveprimet e zgjatura, komplekse të përdoruesve pa humbur fillin e bisedës. Zhvilluesit, një nga aspektet më domethënëse të lëshimit është licencimi i tij. Qwen3-thinging-25507 është në dispozicion nën licencën Apache 2.0 , një marrëveshje shumë e vogël dhe komerciale miqësore. Kjo lejon organizatat të shkarkojnë, modifikojnë dhe vendosin lirshëm modelin. Ai i jep ndërmarrjeve kontroll të plotë mbi të dhënat e tyre të intimitetit, sigurisë, kostos dhe latencës, duke adresuar shqetësimet kryesore për bizneset që veprojnë në industri të rregulluara ose me informacione të ndjeshme. çmimi është i vendosur në 0,70 dollarë për milion shenja hyrëse dhe 8,40 $ për milion shenja të daljes , me një Tier të lirë për zhvilluesit në eksperiment. href=”https://openrouter.ai/models/qwen/qwen3-235b-a22b-thinking-2507″target=”_ bosh”> Qasuni në model përmes platformave si OpenRouter . Isshtë i pajtueshëm me kornizat agjentike si qwen-Agent , duke lehtësuar integrimin në komplekse, flukset e automatizuara që kërkojnë planifikim dhe përdorimin e mjeteve. Syzet

Modeli i mendimit QWEN3 është i fundit në një sukses të shpejtë të lëshimeve nga Alibaba. Ekipi QWEN gjithashtu kohët e fundit nisi një model të ri të koduesit masiv 480b-parametër, dhe një model përkthimi shumëgjuhësh, duke ndërtuar një ekosistem gjithëpërfshirës të AI me burim të hapur. Strategjia duket se është një nga sigurimi i një grupi të plotë mjetesh të fuqishme, të hapura për zhvilluesit.

Koha e këtij lëshimi ishte qartë strategjike. Erdhi vetëm një ditë para se Alibaba të shikonte syzet e reja të saj të zgjuara”Quark AI”në Konferencën Botërore të Inteligjencës Artificiale në Shanghai. Syzet mundësohen nga seria e re QWEN3, një veprim i krijuar për të treguar aplikimin në botë reale të AI-së së tij të fuqishme. Duke provuar aftësitë e tij të klasit botëror të AI-së pak para se të zbulonte harduerin, Alibaba ekzekutoi një”shfaqje, mos i thuaj”strategjisë për të ndërtuar besimin e tregut.

Modeli i ri i Arsyetimit të Alibaba Tops Openai dhe Google Benchmarks në Release Major Source Open

Published by All Things Windows on July 27, 2025

IT Info

GitHub lëshon mjet shkëndijë i cili mund të ndërtojë aplikacione të plota nga një shpejtë e vetme

IT Info

Meta zbulon shiritin e dore për kontrollin e gjesteve, duke përkthyer lëvizjet e muskujve në komanda

IT Info

Microsoft pretendon se çështjet e Windows 11 24H2 BSOD & Windows Firewall janë rregulluar

Modeli i ri i Arsyetimit të Alibaba Tops Openai dhe Google Benchmarks në Release Major Source Open

Published by All Things Windows on July 27, 2025

Related Posts

IT Info

GitHub lëshon mjet shkëndijë i cili mund të ndërtojë aplikacione të plota nga një shpejtë e vetme

IT Info

Meta zbulon shiritin e dore për kontrollin e gjesteve, duke përkthyer lëvizjet e muskujve në komanda

IT Info

Microsoft pretendon se çështjet e Windows 11 24H2 BSOD & Windows Firewall janë rregulluar