Alibaba po përshpejton garën globale të AI me Websailor, një agjent i ri me burim të hapur të lëshuar në 4 korrik. Zhvilluar nga laboratori i saj Tongyi, Websailor është krijuar për të zotëruar detyra shumë komplekse të kërkimit të informacionit që mashtrojnë modelet më aktuale. Kompania pretendon se agjenti i saj mbyll hendekun e performancës me sistemet kryesore të pronarit nga konkurrentët si Openai. Ky lëshim strategjik, në dispozicion në github , synon të çimentojë pozicionin e Alibaba-s në kompleksin e ri të KOSTEASTEMIT OFERCELY OFIRCE. Arsyetimi

Në zemër të WebSailor është një strategji e sofistikuar e trajnimit e krijuar për të mësuar modelet se si të trajtojnë paqartësinë. Qasja lëviz përtej përgjimit të thjeshtë të pyetjeve, duke u përqëndruar në vend të kësaj në atë që studiuesit i quajnë”Niveli 3″Probleme: Detyrat pa rrugë të qartë zgjidhjeje që kërkojnë eksplorim të thellë. src=”të dhëna: image/svg+xml; nitro-empty-id=mty0mjoxndy2-1; base64, phn2zyb2awv3qm94psiwidagmty1niaxntey Iib3awr0ad0imty1niigagvpz2h0psixnteyiib4bwxucz0iahr0cdovl3d3dy53my5vcmcvmjawmc9zdmcipjwvc3znpg==”>

Për të gjeneruar këto sfida, ekipi krijoi Sailorfog-qa, një sindikatë e të dhënave tubacioni . Ai ndërton grafikë të njohurive komplekse nga faqet e internetit të botës reale dhe më pas me qëllim errëson informacionin-si kthimi i datave të sakta në periudha të paqarta-për të detyruar agjentin të arsyetojë dhe të lidh fakte të ndryshme. ku”Kufizimet Kognitive të Kryqëzimit të Njeriut paraqesin një kufi kritik në trajnimin LLM”. Ekipi gjithashtu shmang imitimin e drejtpërdrejtë të arsyetimit folje të modeleve të mësuesve. Në vend të kësaj, ata rindërtojnë mendime koncize, të orientuara nga veprimi për të dhënat e trajnimit, duke parandaluar”ndotjen stilistike”. Fillon me një akordim të refuzimit të rregullimit të mirë (RFT)”fillimi i ftohtë”për të ndërtuar aftësi themelore. Kjo pasohet nga mësimi i përforcimit duke përdorur një algoritëm me porosi, duke kopjuar optimizimin e politikës së marrjes së mostrave (DUPO), për të rafinuar strategjitë eksploruese të agjentit në mënyrë efikase. Sipas standardeve të publikuara, versioni 72B i modelit arrin rezultatet më të larta në testet e vështira të shfletuesit në të dy anglishten dhe kinezët. Në provën angleze, ajo shënoi 12.0. Studiuesit pohojnë se”Websailor në mënyrë të konsiderueshme tejkalon të gjithë agjentët me burim të hapur në detyrat komplekse të kërkimit të informacionit, duke përputhur performancën e agjentëve të pronarit dhe mbylljen e hendekut të aftësive.”Punimi nënvizon se modeli modest i Websailor-7B me vendosmëri tejkalon agjentët e ndërtuar në modele shumë më të mëdha 32B, duke nënvizuar efikasitetin e paradigmës së re.

Agjenti gjithashtu tregon pajtueshmëri të fortë në rënie. Pavarësisht se është i trajnuar për probleme jashtëzakonisht të vështira, Websailor tejkalon metodat e tjera në standardin më të thjeshtë, të bazuar në fakte të thjeshta, duke demonstruar se aftësitë e tij të përparuara të arsyetimit janë të gjithanshme dhe nuk kompromentojnë performancën në detyrat themelore. Ajo zbarkon në mes të një”lufte të njëqind modelesh”të ashpër në Kinë, ku gjigantët e teknologjisë janë duke buruar në mënyrë agresive punën e tyre për të kapur pjesën e tregut. Masa pozicionon strategjikisht Alibaba si një udhëheqës në zhvillimin e avancuar, të hapur të AI. Laboratori i Huawei lëshoi ​​një mohim të fortë, duke thënë se modeli i tij ishte”… jo i bazuar në trajnime shtesë të modeleve të prodhuesve të tjerë…”dhe u zhvillua në mënyrë të pavarur. Kjo shtytje ushqehet nga presione më të gjera gjeopolitike, pasi sanksionet e Sh.B.A-së kufizojnë qasjen në pajisje të nivelit të lartë dhe i detyrojnë firmat kineze të ndërtojnë ekosisteme të vetë-besueshme.

Këto presione shtrihen përtej pajisjeve. Partneritetet e mëdha përballen me një kontroll ndërkombëtar, siç shihet kur AI i mundshëm i Apple merret me Alibaba tërhoqi reagimin në Uashington për shqetësimet e sigurisë kombëtare. Kjo detyron gjigantët e teknologjisë kineze të lundrojnë një peizazh kompleks të konkurrencës së brendshme dhe politikës globale.

Categories: IT Info