即使是元平台也無法免疫AI競賽的驚人成本。 The company spent parts of the last year approaching competitors, including Microsoft, Amazon, and others, seeking financial help to train its flagship Llama large language models, according to four individuals briefed on the discussions reported by The兩個人說,信息。
據報導,這些提議被稱為“ Llama Consortium”音調,這是由Meta內部的憂慮驅動的,因為其人工智能開發所需的資源不斷升級。作為甜味劑,Meta顯然討論了為潛在的財務支持者提供一張意見。儘管如此,這次嘗試揭示了建立領先的AI系統的巨大財務負擔,甚至給具有元口袋的公司帶來了壓力,並在生成型AI中發出了高賭注。 > LLAMA 4 – Meta的最新型號
Meta對資金合作夥伴的搜索量將其最近的Llama 4宣布以新的方式發布。該版本引入了Llama 4 Scout(109B總參數,17B活躍),旨在單GPU使用,具有一個異常大的令牌上下文窗口-能夠一次處理大約750萬個單詞。
它也揭示了更大的Llama 4 Maverick(400B總參數,17B個Active,Active,128 prets formans formans formans offers)。兩者都採用了專家(MOE)架構的混合物,這是一種使用專業子網(專家”的技術,在該技術中,只有必要的架構被激活每個任務,旨在與始終使用所有參數的密集模型相比,在操作過程中的效率更高。
它們還與以後的圖像和圖像相比,它們還使用了
,而不是將本機的圖像和圖像構建為
,而不是添加
基於這些的基礎是尚未發行的Llama 4 Beymoth,這是一種內部用於蒸餾(教較小模型)的200萬億個參數模型,需要在多達32,000 GPU的培訓中進行培訓。 Meta employed techniques like FP8 precision – a lower-precision number format that speeds up calculations – and novel architectural components like interleaved rotary positional embeddings (iRoPE) to handle long sequences effectively.
Building, training, and refining models of this scale and complexity—integrating MoE, multimodality, advanced positional encoding, and achieving competitive benchmarks—inherently demands巨大的計算能力和工程工作,直接解釋了共享投資的潛在需求。儘管MOE提供了潛在的推理效率,但前期培訓成本仍然是一個重要因素。
開發障礙和數據問題
超出原始計算,元資源,用於調整Llama 4的特定輸出和安全性。該公司公開表示其目標是對抗LLMS中的政治偏見,並指出:“眾所周知,所有領先的LLM都有偏見問題的問題-特別是,他們在歷史上偏向於辯論的政治和社會話題……這是由於互聯網上可用的互聯網供應次數供互聯網供應的類型。”部署諸如Llama Guard和Goat Red-Teaming系統之類的安全工具-一種對抗性測試的方法,可以找到漏洞。這些微調和安全層增加了進一步的開發開銷。
可能會增加元的財務微積分,這是關於其培訓數據的持續法律問題,代表了發展挑戰和成本的另一個方面。主動訴訟,包括涉及喜劇演員莎拉·西爾弗曼(Sarah Silverman)的一項訴訟,指控該公司在大量的盜版書籍中培訓了駱駝模型,該數據集是通過Bittorrent文件共享從Libgen等圖書館採購的。據報導,法院文件揭示了內部的憂慮,一位工程師引用說:“從[元擁有的]公司筆記本電腦傾斜並不正確。”
指控在2025年3月下旬浮出水面,即Meta可能還會重新上班,這可能會重新上班,這可能會在這些數據中大約削弱了“可能性”的法律範圍,而銷售了銷售的差異或銷售的差異,或者銷售了銷售的性能,或者銷售的差異或銷售性銷售的差異或銷售性銷售範圍或銷售性銷售的差異或銷售性銷售的差異或銷售性銷售範圍或銷售性銷售性銷售範圍或銷售性銷售的性能是繁瑣的。此類爭議可能代表了整體人工智能開發費用的驅動力,即使較不見異。啟動後不久,這些模型已集成到WhatsApp,Instagram和Facebook的Meta AI功能中。他們還可以下載並通過雲合作夥伴-包括Amazon SageMaker Jumpstart和Microsoft的 -尤其是在定制的商業許可下,而不是典型的開源許可證。這種受控的發布策略使Meta參與Llama的部署,平衡開放性與商業利益。
進一步強調Meta對自己的AI的關注是其動作,據報導,據報導,據報導,在Meta的iOS應用程序中阻止了Apple的System Winder Apple Intelligence。這樣可以防止iPhone用戶在Facebook或Instagram中使用Apple的AI編寫工具或GenMoji,而是將其推向了Meta的基於Llama的替代方案。
,儘管在2024年中期,據報導,Meta和Apple之間的潛在AI合作夥伴關係,但據報導,這種競爭性的動作還是在較早的2024年中期不成功的演講,但據報導,據報導,據報導,這種競爭力不佳。 Meta的方法也不同於蘋果以隱私為中心的,通常是在設備上的模型,這是Meta公開討論對Llala 4的政治傾向的公開討論以及其同時進行的,同時在美國共享2025年1月2025年共享
Meta計劃的第三方事實檢查的同時進行的,有爭議的事實檢查。 href=“ https://www.llama.com/events/llamacon/signup/” target=“ _ blank”> llamacon event 計劃於4月29日舉行