Alibaba versnelt de Global AI-race met WebSailor, een nieuwe open-source webagent die op 4 juli is uitgebracht. Ontwikkeld door het Tongyi-laboratorium, WebSailor is ontworpen om zeer complexe informatiezoekende taken te beheersen die de meeste huidige modellen verbijsteren. Het bedrijf beweert dat zijn agent de prestatiekloof sluit met toonaangevende eigen systemen van concurrenten zoals OpenAI.

Met behulp van een nieuwe trainingsmethode gericht op problemen met hoge zekerheid kan WebSailor navigeren van enorme digitale landschappen om antwoorden te vinden, een belangrijke stap in de richting van het bereiken van”Superhuman”redenering. Deze strategische release, Beschikbaar op github , streeft naar cement alibaba’s positie in de fiercely Competitive Open-Source Ai EcoSyyM. Redeneren

is de kern van WebSailor een verfijnde trainingsstrategie die is ontworpen om modellen te leren hoe om te gaan met dubbelzinnigheid. De aanpak gaat verder dan eenvoudige vraag-beantwoorden, in plaats daarvan gericht op wat de onderzoekers”niveau 3″problemen noemen: taken met geen duidelijk oplossingspad die diepe verkenning vereisen.

Om deze uitdagingen te genereren, heeft het team sailorfog-qa, a data syn>. Het bouwt complexe kennisgrafieken van real-world websites en verdoezelt vervolgens opzettelijk informatie-zoals het omzetten van precieze datums in vage periodes-om de agent te dwingen te redeneren en verschillende feiten te verbinden.

Het doel, volgens de

Deze gegevens worden gebruikt in een tweetraps trainingsregime. Het begint met een afwijzingsbemonsteringsfine-tuning (RFT)”Cold Start”om fundamentele vaardigheden op te bouwen. Dit wordt gevolgd door versterkingsonderwijs met behulp van een aangepast algoritme, duplicating sampling beleidoptimalisatie (DUPO), om de verkennende strategieën van de agent efficiënt te verfijnen.

instelling van een nieuwe open-source-agent van een nieuwe open-source-agent. Volgens de gepubliceerde benchmarks behaalt de 72B-versie van het model topscores op de moeilijke browsecomp-tests in zowel Engels als Chinees.

Op de Chinese versie van de benchmark, scoorde WebSailor-72B 30.1, waarbij pariteit wordt bereikt met eigen agenten zoals DoubaO-onderzoek en aanzienlijk outperforming andere open-source modellen. Op de Engelse test scoorde het 12.0. De onderzoekers beweren dat”WebSailor aanzienlijk beter presteert dan alle open-source agenten in complexe taken voor het zoeken naar informatie, het matchen van de prestaties van eigen agenten en het sluiten van de capaciteiten kloof.”

Alibaba Websailor AI Agent Benchmarks versus concurrenten (Bron: Alibaba)

Signal, de resultaten die de GAins komen, de resultaten die de GAins komen, de resultaten van de GA’s die de GAins komen. De paper benadrukt dat het bescheiden WebSailor-7B-model beslissend overtrof dan agenten gebouwd op veel grotere 32B-modellen, waardoor de werkzaamheid van het nieuwe paradigma wordt onderstreept.

De agent vertoont ook een sterke neerwaartse compatibiliteit. Ondanks het feit dat ze zijn getraind op extreem moeilijke problemen, overtreft WebSailor andere methoden op de eenvoudigere, op feiten gebaseerde simpleqa-benchmark, wat aantoont dat de geavanceerde redeneervaardigheden veelzijdig zijn en de prestaties niet in gevaar brengen bij basistaken.

Navigeren van China’s fiere AI-race

Deze afgifte bestaat niet in een vacuum. Het landt te midden van een felle”oorlog van honderd modellen”in China, waar technische reuzen hun werk agressief openen om het marktaandeel te veroveren. De verhuizing positioneert Alibaba strategisch als een leider in geavanceerde, open AI-ontwikkeling.

De competitieve spanning werd onlangs benadrukt toen een onderzoeksgroep beweerde dat het nieuwe Pangu-model van Huawei een kopie was van het eigen QWEN-model van Alibaba. Het lab van Huawei gaf een stevige weigering en verklaarde dat het model was:”… niet gebaseerd op incrementele opleiding van de modellen van andere fabrikanten…”en ontwikkelde zich onafhankelijk. Deze push wordt gevoed door bredere geopolitieke druk, omdat Amerikaanse sancties de toegang tot tophardware beperken en Chinese bedrijven dwingen zelfredzame ecosystemen te bouwen.

Deze druk gaat verder dan hardware. Belangrijke partnerschappen worden geconfronteerd met internationaal onderzoek, zoals te zien wanneer de potentiële AI-omgang van Apple met Alibaba terugslag in Washington trok over nationale veiligheidsproblemen. Dit dwingt Chinese technische reuzen om te navigeren in een complex landschap van binnenlandse concurrentie en wereldwijde politiek.