Alibaba beschleunigt das globale AI-Rennen mit WebSailor, einem neuen Open-Source-Webagenten, der am 4. Juli veröffentlicht wurde. Websailor wurde entwickelt, um hochkomplexe Informationssuchungsaufgaben zu beheben, die die meisten aktuellen Modelle verblüfft. Das Unternehmen behauptet, sein Agent schließt die Leistungslücke mit führenden proprietären Systemen von Wettbewerbern wie OpenAI. Diese strategische Veröffentlichung, Verfügbar auf Github , zielt darauf ab, die Position von Alibaba in der starken, starken und starken Schäden zu einem neuen Ekosystox zu zementieren. Argumentation
im Herzen von WebSailor ist eine hoch entwickelte Trainingsstrategie, mit der Modelle mitspielsweise mit Mehrdeutigkeiten umgehen können. Der Ansatz bewegt sich über die einfache Frage-Beantwortung hinaus und konzentriert sich stattdessen auf das, was die Forscher als”Level 3″-Probleme bezeichnen: Aufgaben ohne klare Lösungsweg, die eine tiefe Erforschung erfordern.
Diese Daten werden in einem zweistufigen Trainingsregime verwendet. Es beginnt mit einer Ablehnung, die Feinabstimmung (RFT) „kalter Start“ zum Aufbau von grundlegenden Fähigkeiten aufbaut. Darauf folgt das Verstärkungslernen unter Verwendung eines benutzerdefinierten Algorithmus, der die optimale Abtastpolitikoptimierung (DUPO) doppelte, die explorativen Strategien des Agenten effizient verfeinert. Laut den veröffentlichten Benchmarks erzielt die 72B-Version des Modells die Top-Ergebnisse der schwierigen Brows-Comp-Tests sowohl in englischer als auch in chinesischen. Bei dem englischen Test erzielte es 12,0. Die Forscher behaupten, dass „Websailor alle Open-Source-Agenten in komplexen Informationssuchungsaufgaben, die Leistung von Proprietary Agents und die Schließung der Capability-Lücke erheblich übertreffen. Das Papier zeigt, dass das bescheidene WebSailor-7B-Modell die auf viel größeren 32B-Modelle basierenden Agenten übertrifft und die Wirksamkeit des neuen Paradigmas unterstreicht.
Der Agent zeigt auch eine starke Abwärtskompatibilität. Obwohl Websailor in extrem schwierigen Problemen geschult ist, übertrifft er andere Methoden auf dem einfacheren, faktenbasierten SimpleQA-Benchmark und zeigt, dass seine fortgeschrittenen Argumentationsfähigkeiten vielseitig sind und die Leistung bei grundlegenden Aufgaben nicht beeinträchtigen. Es landet inmitten eines heftigen „Kriegskrieges von hundert Modellen“ in China, in dem Tech-Giganten ihre Arbeit aggressiv offen machen, um den Marktanteil zu erfassen. Der Schritt positioniert Alibaba strategisch als führend in der fortgeschrittenen, offenen KI-Entwicklung. Das Labor von Huawei gab eine feste Ablehnung heraus und erklärte, sein Modell sei „… nicht auf inkrementellem Training der Modelle anderer Hersteller…“ und unabhängig voneinander entwickelt. Dieser Druck wird durch einen breiteren geopolitischen Druck angeheizt, da die US-Sanktionen den Zugang zu hochrangiger Hardware einschränken und chinesische Unternehmen dazu zwingen, eigenständige Ökosysteme aufzubauen.
Diese Drucke erstrecken sich über die Hardware hinaus. Große Partnerschaften stehen vor einer internationalen Prüfung, wie die potenzielle KI von Apple mit Alibaba in Washington gegen nationale Sicherheitsbedenken zurückzuführen war. Dies zwingt die chinesischen Technologiegiganten, eine komplexe Landschaft des häuslichen Wettbewerbs und der globalen Politik zu steuern.