Alibaba accelerează cursa Global AI cu WebAilor, un nou agent web open-source lansat pe 4 iulie. Dezvoltat de laboratorul său Tongyi, WebAilor este conceput pentru a stăpâni sarcini extrem de complexe de căutare a informațiilor, care afectează majoritatea modelelor actuale. Compania susține că agentul său închide diferența de performanță cu sisteme de frunte de la concurenți precum OpenAI.
folosind o nouă metodologie de formare axată pe probleme de incertitudine înaltă, WebAilor poate naviga pe peisaje digitale vaste pentru a găsi răspunsuri, un pas cheie către obținerea raționamentului „suprauman”. Această versiune strategică, Disponibil pe github , are ca scop să cimenteze poziția Alibaba în funcția de o ecosistem AI NOU OPRADIME OPRIENCE. Motiving
În centrul site-ului Web este o strategie de formare sofisticată, concepută pentru a învăța modelele cum să se ocupe de ambiguitate. Abordarea se deplasează dincolo de simpla răspuns la întrebări, concentrându-se în schimb pe ceea ce cercetătorii numesc „nivel 3″ probleme: sarcini fără o cale de soluție clară care necesită o explorare profundă.
Pentru a genera aceste provocări, echipa a creat Sailorfog-qa, o conductă de sintheză a datelor . Construiește grafice complexe de cunoștințe de pe site-uri web din lumea reală și apoi ascunde în mod deliberat informațiile-cum ar fi transformarea datelor precise în perioade vagi-pentru a forța agentul să motiveze și să conecteze fapte disparate.
obiectivul, conform cercetare/2507.02592″țintă de instruire=”_ blank”> cercetare/2507.02592″Target=”_ Blank”> Research Paper , pentru a crea un mediu de instruire=”_ blank”> cercetare/anal. „Transcenderea limitărilor cognitive umane reprezintă o frontieră critică în formarea LLM.” Echipa evită, de asemenea, imitarea directă a raționamentului verbos al modelelor de profesori. În schimb, reconstruiesc gânduri concise, orientate spre acțiune, pentru datele de instruire, împiedicând „contaminarea stilistică”.
Aceste date sunt utilizate într-un regim de instruire în două etape. Începe cu o eșantionare de respingere a reglării fine (RFT) „Start rece” pentru a-și dezvolta abilități fundamentale. Aceasta este urmată de învățarea de consolidare folosind un algoritm personalizat, duplicarea optimizării politicii de eșantionare (DUPO), pentru a rafina eficient strategiile de explorare ale agentului.
stabilirea unui nou benchmark open-source
Agentul de performanță al lui Alibaba. Potrivit valorilor de referință publicate, versiunea de 72B a modelului atinge scoruri de top la testele dificile ale browscomp-ului atât în engleză, cât și în chineză.
pe versiunea chineză a referinței, WebAilor-72B a obținut 30.1, obținând paritate cu alte modele de proprietăți. La testul englezesc, a marcat 12.0. Cercetătorii afirmă că „WebAilor depășește în mod semnificativ toți agenții open-open-source în sarcini complexe de căutare a informațiilor, care să corespundă performanței agenților proprii și să închidă decalajul de capacitate. Lucrarea evidențiază faptul că modelul Modest WebAilor-7B modelează în mod decisiv agenții construiți pe modele de 32B mult mai mari, subliniind eficacitatea noii paradigme.
Agentul arată, de asemenea, o compatibilitate descendentă puternică. În ciuda faptului că a fost instruit cu probleme extrem de dificile, WebAilor depășește alte metode pe referința simplă mai simplă, bazată pe fapte, demonstrând că abilitățile sale avansate de raționament sunt versatile și nu compromit performanța în sarcinile de bază.
Navigarea navigației Chinei AI AI
această versiune nu există în funcție. Acesta aterizează în mijlocul unui „Război de o sută de modele” în China, unde giganții tehnologici își aprob în agresiv activitatea lor pentru a capta cota de piață. Mișcarea poziționează strategic Alibaba ca lider în dezvoltarea AI avansată, deschisă.
Tensiunea competitivă a fost evidențiată recent atunci când un grup de cercetare a presupus că noul model Pangu al lui Huawei a fost o copie a modelului QWEN al Alibaba. Laboratorul lui Huawei a emis o negare fermă, afirmând că modelul său este „… nu se bazează pe pregătirea incrementală a modelelor altor producători…” și s-a dezvoltat independent.
Acest fundal de rivalitate internă intensă include jucători importanți precum Baidu cu modelele sale ernie și tencentul cu Hunyuan, toate pentru a domina. Această apăsare este alimentată de presiuni geopolitice mai largi, deoarece sancțiunile din SUA limitează accesul la hardware-ul de top și forțează firmele chineze să construiască ecosisteme auto-delate.
Aceste presiuni se extind dincolo de hardware. Parteneriatele majore se confruntă cu un control internațional, așa cum se vede atunci când potențialul AI al Apple cu Alibaba a atras reacția la Washington pentru problemele de securitate națională. Acest lucru îi obligă pe giganții tehnologici chinezi să navigheze pe un peisaj complex al concurenței interne și al politicii globale.