Ang mga mananaliksik mula sa Google ay nagpakilala ng isang bagong balangkas na tinatawag na Chain-of-Agents (CoA), na idinisenyo upang tugunan ang isa sa mga pinaka-paulit-ulit na limitasyon ng mga malalaking modelo ng wika (LLMs): pangangasiwa sa mga gawaing may mahabang konteksto.

Gumagamit ang CoA ng multi-agent collaboration model upang makabuluhang mapabuti ang kahusayan at katumpakan ng pangangatwiran sa mga gawain tulad ng pagbubuod, pagsagot sa tanong, at pagkumpleto ng code.

Sa pamamagitan ng paghahati ng mahahabang input sa mas maliit, mapapamahalaan chunks at italaga ang mga ito sa mga dalubhasang ahente, ang balangkas ay naghahatid ng mas mahusay na mga resulta kaysa sa mga tradisyonal na diskarte tulad ng Retrieval-Augmented Generation (RAG) at Full-Context mga modelo.

Nauugnay: Inilabas ng Google ang Agentspace sa Hamunin ang Lumalagong AI Ecosystem ng Microsoft

Ang CoA framework nag-aalok ng paradigm shift para sa AI, lalo na sa ang kakayahang magproseso ng malawak na mga input na kung hindi man ay lalampas sa mga limitasyon ng mga LLM. Binigyang-diin ng Google ang pagiging simple at pagiging epektibo ng diskarte, na naglalarawan dito bilang”walang pagsasanay, gawain/haba na agnostic, naiintindihan, at cost-effective.”

The Challenges of Long-Context AI Tasks

Ang isa sa mga pangunahing hadlang sa pagsulong ng mga kakayahan ng AI ay nasa pamamahala ng mga pang-context na input context window na naglilimita sa kanilang kakayahang magproseso ng malalaking dataset nang walang truncation

Ang mga paraan ng pagbabawas ng input, gaya ng RAG, ay sumusubok na malampasan ito sa pamamagitan ng pagkuha lamang ng mga pinaka-kaugnay na bahagi ng input mababang katumpakan sa pagkuha, na humahantong sa hindi kumpletong impormasyon

Kaugnay: NVIDIA Advances Agentic AI kasama ang Llama at Cosmos Nemotron. Mga Modelo

Sa kabilang banda, pinalalawak ng mga modelong Full-Context ang kanilang kapasidad sa pagpoproseso ngunit nahaharap sa mga hindi kahusayan sa pag-compute, lalo na habang tumataas ang haba ng input na ito ang mga modelong ito ay madalas na nakakaharap sa isyu na”nawawala sa gitna,”kung saan inalis sa priyoridad ang kritikal na impormasyon sa gitna ng dataset.

Ang balangkas ng CoA ng Google ay tumutugon sa mga isyung ito sa pamamagitan ng paggamit ng collaborative system kung saan ang mga ahente ng manggagawa ay nagpoproseso ng mga partikular na segment ng input sunud-sunod. Ang bawat ahente ng manggagawa ay pinipino at inililipat ang mga natuklasan nito sa susunod, tinitiyak na walang konteksto ang mawawala.

Ang isang ahente ng tagapamahala pagkatapos ay nag-synthesize ng lahat ng nakalap na impormasyon upang makabuo ng panghuling tugon. Ang stepwise na diskarte na ito ay ginagaya ang paglutas ng problema ng tao, kung saan ang mga gawain ay hinati sa mas maliliit na bahagi para sa mas mahusay na pagtuon at katumpakan.

Larawan: Google

Binigyang-diin ng mga mananaliksik ng Google ang motibasyon sa likod ng framework, na nagsasabing,”Kapag ang window ay naging mas mahaba kaysa sa kanilang pinalawak na mga kapasidad sa pag-input, ang mga naturang LLM ay nahihirapan pa ring tumuon sa kinakailangang impormasyon upang malutas ang gawain at magdusa mula sa hindi epektibong paggamit ng konteksto gaya ng’nawala sa gitna’na isyu.”

Paano Gumagana ang Chain-of-Agents

Ang Ang balangkas ng Chain-of-Agents ay gumagana sa dalawang natatanging yugto Sa unang yugto, ang mga ahente ng manggagawa ay nagpoproseso ng mga itinalagang bahagi ng input, na gumaganap ng mga gawain tulad ng pagkuha ng mga sumusuportang ebidensya o pagpapasa ng mga nauugnay na natuklasan

Ang chain ng komunikasyon na ito bubuo ang bawat manggagawa sa mga insight ng nauna Sa ikalawang yugto, pinagsasama-sama ng ahente ng tagapamahala ang lahat ng nakolektang ebidensya at bumubuo ng magkakaugnay na panghuling output. Ang hierarchical structure na ito ay hindi lamang nagpapabuti sa katumpakan ng pangangatwiran ngunit binabawasan din ang mga gastos sa computational.

Kaugnay: Salesforce Unveils Agentforce 2.0, Expanding AI Agents Beyond CRM

Ipinaliwanag ng Google ang disenyo ng framework bilang”nagsasama-sama ng pagbabasa at pangangatwiran, na nagtatalaga sa bawat ahente ng isang maikling konteksto.”Ang diskarte na ito ay nagpapahintulot sa CoA na pangasiwaan ang mahabang konteksto nang hindi nangangailangan ng mga LLM na iproseso ang lahat mga token nang sabay-sabay

Sa pamamagitan ng pagbabawas ng computational complexity, nag-aalok ang CoA ng mas mahusay at nasusukat na solusyon para sa mga gawaing pang-konteksto.

Mahusay na Pagganap sa Mga Benchmark

Nagsagawa ang Google ng mga malawak na eksperimento sa siyam na dataset upang suriin ang pagganap ng CoA na ito ay sumasaklaw sa iba’t ibang domain, kabilang ang pagsagot sa tanong (hal., HotpotQA, MuSiQue), pagbubuod (hal., QMSum, GovReport), at pagkumpleto ng code (hal., RepoBench-P

Patuloy na nalampasan ng CoA ang mga modelo ng RAG at Full-Context sa parehong katumpakan at kahusayan.

Pinagmulan: Google

Halimbawa, sa ang HotpotQA dataset, napakahusay ng CoA sa multi-hop na pangangatwiran, isang gawain na nangangailangan ng pag-synthesize ng impormasyon mula sa maraming mapagkukunan upang makarating sa isang tumpak na sagot.

Bagama’t madalas na nabigo ang RAG na kumonekta sa semantically disjointed ngunit may kaugnayan sa konteksto na mga piraso ng impormasyon, sistematikong pinagsama-sama ng CoA ang mga insight mula sa bawat input chunk. Sinabi ng Google,”Ipinapakita ng aming mga resulta na sa lahat ng siyam na dataset, nakakakuha ang CoA ng pagpapabuti sa lahat ng mga baseline nang hanggang 10%.”

Sa dataset ng NarrativeQA, ipinakita ng CoA ang kakayahang malampasan ang pagganap ng mga modelong Full-Context, kahit na ang mga may kakayahang humawak ng 200k token Sa pamamagitan ng paglilimita sa window ng konteksto sa 8k na mga token at paggamit ng multi-agent na diskarte nito, napanatili ng CoA ang mataas na pagganap habang makabuluhang. binabawasan ang mga gastos sa computational.

Source: Google

Applications in Real-World Mga Sitwasyon

Ang mga praktikal na aplikasyon ng CoA ay umaabot sa maraming industriya Sa legal na pagsusuri, ang CoA ay maaaring magproseso ng malawak na mga legal na dokumento at matukoy ang mga kritikal na impormasyon nang hindi nawawala ang mga pangunahing detalye. Sa pangangalagang pangkalusugan, maaaring pagsama-samahin ng balangkas ang mga rekord ng pasyente mula sa iba’t ibang mapagkukunan upang magbigay ng komprehensibong diagnostic na mga insight.

Maaaring gamitin ng mga institusyong pang-akademiko at pamahalaan ang CoA para sa pagbubuod ng pananaliksik, pag-synthesize ng mga natuklasan mula sa malalaking dataset.

Ang kakayahan ng CoA na pangasiwaan ang mga gawain sa pagkumpleto ng code ay nagha-highlight din sa potensyal nito sa pagbuo ng software. Sa pamamagitan ng pagsusuri sa malalaking codebase at pagtukoy ng mga dependency, maaaring i-optimize ng framework ang mga daloy ng trabaho para sa mga developer na nagtatrabaho sa mga kumplikadong system.

Kaugnay: Inilunsad ng Cognition.ai ang Devin AI Software Engineer nito sa halagang $500/buwan

Mga Paghahambing sa Mga Kakumpitensya sa Industriya

Ang pagpapakilala ng Google ng CoA ay nagpapakita ng lumalaking diin sa solong AI mga ahente at collaborative na mga framework ng ahente ng AI sa loob ng industriya ng tech. Inilunsad lang ng OpenAI ang Operator, isang ahente ng AI na nakabatay sa browser na idinisenyo para sa automation ng gawain, habang inilabas ng Microsoft ang AutoGen v0.4 kasama ang Magentic-One framework para sa mga multi-agent na daloy ng trabaho.

Ang CoA ng Google ay itinatakda ang sarili nito sa pamamagitan ng partikular na pagtutok sa pangmatagalang pangangatwiran at pagpoproseso ng gawain.

Ayon sa mga mananaliksik ng Google, ang mga LLM ay kadalasang nakakatanggap ng hindi kumpletong konteksto dahil sa mga limitasyon sa mga tradisyonal na pamamaraan, ngunit ang CoA tinutugunan ito sa pamamagitan ng pagpoproseso ng buong input nang magkakasama sa pamamagitan ng maraming ahente.

Ang pagtutok na ito sa mga gawaing pang-konteksto ay nagbibigay sa CoA ng kakaibang kalamangan sa mga lugar na nangangailangan malawak na synthesis ng impormasyon.

Isang Sulyap sa Kinabukasan ng AI

Ang pagpapakilala ng CoA ay nagha-highlight ng mas malawak na trend sa AI development patungo sa modular at collaborative system. Sa pamamagitan ng pagpapagana sa mga dalubhasang ahente na magtulungan, ipinapakita ng CoA kung paano maaaring mapahusay ng paghahati ng mga gawain ang katumpakan at scalability.

Ang balangkas ay maaaring magbigay ng daan para sa mga pagsulong sa artificial general intelligence (AGI), kung saan ang mga system ay may kakayahang mangatuwiran sa antas ng tao at paglutas ng problema.

Ang mga pagsisikap ng Google ay binibigyang-diin din ang kahalagahan ng cost-effective at nabibigyang-kahulugan na mga solusyon sa enterprise AI.

Categories: IT Info