阿里巴巴的研究人員介紹了Zerosearch,這是一個開創性的框架,旨在重新定義大型語言模型(LLMS)獲得信息檢索技能。這個新系統訓練AI來模擬搜索引擎互動,有效地學習“ Google本身”,而無需實時商業API呼叫的高價標籤。該開發內容在A Scientific Paper 可以大大降低進入障礙的障礙,可以降低進入能夠創建能夠自動訓練的高級AI系統的障礙。據研究人員稱,搜索增強的LLM驚人地達到了88%。這是通過避免對研究論文所描述的“頻繁投放的需求,有可能涉及數十萬搜索請求的需求,這可能會導致大量的API支出並嚴重限制可擴展性。 src=“ https://winbuzzer.com/wp-content/uploads/2023/09/alibaba-campus-ficial-alibaba-scaled.jpg-“>

“>

“>

含義是深遠的,潛在地使高級助手的助手更加依賴高級平台,而不是依賴高級助手,並且可以使高級的平台變得更加依賴。阿里巴巴雲說:“我們創建了一個系統,LLM可以通過模擬來發展搜索技能,從而消除了對資源密集型現實世界搜索的需求。 ” They added, “This makes advanced AI more accessible to organizations of all sizes.”

Alibaba has underscored its commitment to broader adoption by making the ZeroSearch code, datasets, and pre-trained models openly available through its GitHub repository和官員 ZeroSearch項目頁面,促進了更廣泛的採用和進一步的研究。

微調(SFT)過程。該初始步驟將LLM轉換為專業的“檢索模塊”。該模塊旨在生成相關文檔,重要的是,“嘈雜”或無關緊要的文檔來響應查詢。

正如其ARXIV論文中提到的,阿里巴巴團隊的主要見解是,LLMS已經“在大規模的預期和產生相關文檔的大型預期和搜索搜索中,已經獲得了廣泛的世界知識。 They further elaborate that the “primary difference between a real search engine and a simulation LLM lies in the textual style of the returned content.”

Following SFT, ZeroSearch employs a reinforcement learning phase guided by a ‘curriculum-based rollout strategy.’ The ZeroSearch project page explains that this strategy involves the research team introducing “a curriculum rollout mechanism during training, in which the quality of the generated documents is隨著時間的流逝,逐漸退化,以模擬越來越具有挑戰性的檢索方案。”

信息質量的受控降級使AI首先掌握了基本搜索機制和輸出格式。隨後,它學會了瀏覽更複雜和模棱兩可的信息景觀。該系統的學習以基於F1分數的獎勵機制為指導,重點是模擬搜索結果產生的答案的準確性。

令人印象深刻的性能和巨大的成本降低

ZeroSearch的有效性不僅是理論上的。七個主要的 Question-Asswering DataSets 的全面實驗已經證明了其功能。根據VentureBeat的報導,A 7-billion參數參數ZeroSearch reterieval module 與Google搜索相比可比href=“ https://huggingface.co/sunhaonlp/searchsimulation_14b” target=“ _ blank”> 14英億個參數版本據報導,據報導優於Google搜索。 ZeroSearch項目頁面本身指出,“微調的7B仿真引擎(SFT-7B)實現了與Google搜索相當的性能,而14B變體(SFT-14B)甚至超過了它。”在基準測試中,Zerosearch的7B型號得分為33.06,其14b模型得分為33.97,兩者都超過了Google的得分32.47。

財務優勢是Zerosearch吸引力的基礎。阿里巴巴團隊在其ARXIV論文中詳細介紹的成本分析說明,使用通過serpapi 通常費用約為586.70美元。相比之下,在四個A100 GPU上使用14B參數模擬LLM與ZeroSearch使用ZeroSearch的價格僅為70.80美元,而與API相關的費用降低了88%。這種成本效率與包括QWEN-2.5和LLAMA-3.2在內的各種模型家族兼容,並在 民主化先進的AI和未來的Outlook

ZeroSearch訓練有力的搜索能力的能力而無需直接依賴外部搜索引擎API,這帶來了重大變化。 It directly addresses two major hurdles in developing search-augmented LLMs: the “uncontrolled document quality”and the “prohibitively high API costs”associated with traditional RL training methods that use live search engines, as outlined in the project’s abstract.

By simulating the search environment, developers gain finer control over the information the AI encounters, potentially leading to more robust and reliable models.

The通過Github開放源是更廣泛的社區參與和創新的關鍵。雖然ZeroSearch框架本身需要用於模擬LLM的GPU資源,但研究人員在論文中承認的一個限制-“部署模擬搜索LLM需要訪問GPU服務器。

雖然比商業上的API更具成本效益,而這比商業上的使用率更高,這引入了額外的基礎架構成本,而總體上降低了成本和依賴性。除此之外,ZeroSearch還顯示了動態控制內容質量的獨特能力。

此創新在更廣泛的行業推動以提高LLM效率和可訪問性。例如,DFLOAT11技術為LLM重量提供了無損壓縮,而Sakana AI的NAMMS專注於為長上下文優化內存。 IBM的BAMBA混合動力AI模型是另一個示例,針對變壓器的架構速度限制。 ZeroSearch通過專門解決構建具有搜索能力的LLM的培訓成本和數據控制方面來雕刻其利基市場,這可能使傳統搜索引擎對AI開發的這一方面不可或缺。

Categories: IT Info