Ang Alibaba ay nagpapabilis sa pandaigdigang lahi ng AI kasama ang Webilya, isang bagong open-source web agent na inilabas noong Hulyo 4. Binuo ng Tongyi Lab, ang Webilya ay ininhinyero upang makabisado ang kumplikadong mga gawain na naghahanap ng impormasyon na nag-aalsa sa karamihan ng mga kasalukuyang modelo. Inaangkin ng kumpanya ang ahente nito ay isinasara ang agwat ng pagganap na may nangungunang mga sistema ng pagmamay-ari mula sa mga kakumpitensya tulad ng OpenAI. Ang madiskarteng paglabas na ito, magagamit sa github , naglalayong semento ang posisyon ng alibaba sa mabangis na open-source ai ecosystem. Nangangatuwiran Ang diskarte ay gumagalaw na lampas sa simpleng sagot sa tanong, na nakatuon sa halip na tinawag ng mga mananaliksik ang mga”Antas 3″na mga problema: mga gawain na walang malinaw na landas ng solusyon na nangangailangan ng malalim na paggalugad.
Upang makabuo ng mga hamong ito, nilikha ng koponan ang SailorFog-QA, isang data synthesis pipeline . Nagtatayo ito ng mga kumplikadong mga graph ng kaalaman mula sa mga website ng real-world at pagkatapos ay sinasadyang nakakubli ng impormasyon-tulad ng paggawa ng tumpak na mga petsa sa hindi malinaw na panahon-upang pilitin ang ahente na mangatuwiran at ikonekta ang magkakaibang mga katotohanan.”Ang transcending na mga limitasyon ng nagbibigay-malay na tao ay kumakatawan sa isang kritikal na hangganan sa pagsasanay sa LLM.”Iniiwasan din ng koponan ang direktang ginagaya ang pandiwa na pangangatuwiran ng mga modelo ng guro. Sa halip, muling binubuo nila ang maigsi, mga saloobin na nakatuon sa pagkilos para sa data ng pagsasanay, na pumipigil sa”pangkasalukuyan na kontaminasyon.”
Ang data na ito ay ginagamit sa isang regimen na pagsasanay sa dalawang yugto. Nagsisimula ito sa isang pagtanggi sa pag-sampol ng fine-tuning (RFT)”malamig na pagsisimula”upang makabuo ng mga kasanayan sa pundasyon. Sinusundan ito ng pag-aaral ng pampalakas gamit ang isang pasadyang algorithm, pagdoble ng pag-optimize ng patakaran sa pag-optimize (DUPO), upang pinuhin ang mga estratehiya ng exploratory ng ahente. Ayon sa nai-publish na mga benchmark, ang 72B bersyon ng modelo ay nakakamit ng mga nangungunang marka sa mahirap na mga pagsubok sa browsecomp sa parehong Ingles at Tsino. Sa pagsubok sa Ingles, nakapuntos ito ng 12.0. Iginiit ng mga mananaliksik na ang”Websailor ay makabuluhang higit pa sa lahat ng mga ahente ng open-source sa mga kumplikadong gawain na naghahanap ng impormasyon, na tumutugma sa pagganap ng mga ahente ng proprietary at pagsasara ng mga benchmark ng ahente ng ahente kumpara sa mga kakumpitensya (pinagmulan: alibaba) Ang papel ay nagtatampok na ang katamtaman na modelo ng Websinor-7B na tiyak na mga ahente ng outperform na itinayo sa mas malaking 32B na mga modelo, na binibigyang diin ang pagiging epektibo ng bagong paradigma. Sa kabila ng sinanay sa napakahirap na mga problema, ang websailor ay lumampas sa iba pang mga pamamaraan sa mas simple, batay sa katotohanan na Benchmark, na nagpapakita na ang mga advanced na kasanayan sa pangangatuwiran ay maraming nalalaman at hindi nakompromiso ang pagganap sa mga pangunahing gawain. Nakarating ito sa gitna ng isang mabangis na”digmaan ng isang daang mga modelo”sa Tsina, kung saan ang mga higanteng tech ay agresibo na bukas-sourcing ang kanilang trabaho upang makuha ang pagbabahagi ng merkado. Ang paglipat ng madiskarteng posisyon ng Alibaba bilang pinuno sa advanced, bukas na pag-unlad ng AI. Ang lab ng Huawei ay naglabas ng isang firm na pagtanggi, na nagsasabi ng modelo nito ay”… hindi batay sa pagdaragdag ng pagsasanay ng iba pang mga modelo ng tagagawa…”at binuo nang nakapag-iisa. Ang push na ito ay na-fueled ng mas malawak na geopolitical pressure, dahil ang mga parusa sa Estados Unidos ay naglilimita sa pag-access sa top-tier hardware at pilitin ang mga kumpanya ng Tsino na bumuo ng mga ecosystem ng self-reliant. Ang mga pangunahing pakikipagsosyo ay nahaharap sa internasyonal na pagsisiyasat, tulad ng nakikita nang makitungo ang potensyal na AI sa Alibaba Drew Backlash sa Washington dahil sa pambansang mga alalahanin sa seguridad. Pinipilit nito ang mga higanteng tech na Tsino na mag-navigate ng isang kumplikadong tanawin ng kumpetisyon sa domestic at pandaigdigang politika.