在具有里程碑意義的透明度上,Google發布了有關其AI模型的環境成本的第一個詳細數據。 Google的發佈於週四出版,
多年來,生成AI的真實能源成本一直是一個激烈的猜測和辯論的主題。這一披露在對大型技術的越來越大的壓力上逐漸量化了該技術對能源和水的貪婪食慾,提供了至關重要的,儘管公司控制的,但基準。
AI透明度中的第一個:Google對能源使用的數量在Google的分析中添加了一定數量的
能量,發射0.03克CO2等效(GCO2E),並使用0.26毫升的水,如。
公司將這是很小的股份,即在一個非常小的Mictolove中運行一個MicroWave的公司。 Google的首席科學家傑夫·迪恩(Jeff Dean)強調了對日常生活的最小影響,並指出:“……實際上,這等同於您甚至每天都在考慮它的事情,例如觀看幾秒鐘的電視或消耗五滴水或消耗五滴水。 “全面”或“全堆”方法。這種方法是故意建立一致標準並捕獲現實世界中生產系統的總能量吸收的嘗試。它超越了簡單的基準,通常只專注於主動AI加速器芯片,該公司認為這可能會產生誤導。 In its technical paper, Google notes that a lack of consensus on what to measure has led to public estimates for similar AI tasks varying by an order of大小。
該公司的方法旨在反映為Gemini等全球產品服務的運營現實。為了確保高可用性和低潛伏期,必須提供大量容量,但可以閒置,準備處理流量峰值或故障轉移。這種現實的運營成本,以及主機CPU和通用數據中心開銷的權力,通常被排除在學術或第三方估計中。 Google認為這些狹窄的觀點代表了所謂的“ _ blank”>“充滿了樂觀的場景”。主動AI加速器(Google的TPU)僅佔總能量的58%。必要的主機CPU和內存貢獻了24%。配置閒置機消耗的能量使總數增加了10%。最後,8%來自數據中心的開銷,例如冷卻和電源轉換,這是行業標準的功率使用效率(PUE)度量的因素。
這種整體視圖與較狹窄的測量方法有很大的不同。這個綜合邊界的影響很大。儘管它產生了官方的0.24 Wh圖,但Google指出,如果它使用了更有限的方法(僅在其最有效的數據中心中使用主動的AI芯片),則結果將僅是每個提示的0.10 WH。 This 2.4x difference underscores how much energy is consumed by the essential supporting infrastructure required for a reliable service.
In an exclusive interview with MIT Technology谷歌首席科學家傑夫·迪恩(Jeff Dean)證實了該公司的意圖,並指出:“我們希望在包括的所有內容中都非常全面。 “這一詳細的會計顯示,提示的能源成本幾乎是來自AI處理器本身以外的其他系統,這是理解AI的真正環境足蹟的關鍵見解。
效率的33倍飛躍
與穀歌索賠相關,使其效率達到了效率,使得效率達到了效率。 In its sustainability blog post, the company asserts that between May 2024 and May 2025, the energy consumption of a median Gemini prompt plummeted by a factor of 33. When combined with cleaner energy sources, the associated carbon footprint fell an even greater 44-fold.
These staggering improvements are not the result of a single breakthrough but rather the compounding effect of optimizations across what Google calls its “ AI開發的全棧方法。 ” 公司的
在模型水平上,Google指出了更有效的體系結構,例如Experts(MOE)。該技術允許該系統僅激活任何給定查詢的大型模型的一個小型,相關的子集,將計算降低10到100倍。其他軟件技術(例如投機性解碼和蒸餾),諸如Gemini flash之類的較小,優化的模型(例如Gemini Flash),進一步減少了計算負載。該公司強調其自定義設計的張量處理單元(TPU),這些處理單元與其AI模型共同設計,以最大程度地提高每瓦的性能。根據Google的說法,其最新一代的“ Ironwood” TPU的能源效率是其首個公開版本的30倍,為其效率努力提供了強大的硬件基礎。
最後,系統級別的優化起著至關重要的作用。 Google的服務堆棧使用高級ML軟件堆棧和動態,近實時的模型放置,以最大程度地減少加速器空轉,這是大規模部署中浪費能量的重要來源。從模型架構到矽的這些創新層面,共同促進了雙子座環境影響的巨大減少。
令人歡迎的,如果不完整,披露
謹慎地獲得了第一部分數據的發行。密歇根大學ML能量努力的負責人Jae-won Chung告訴MIT Technology Review:“我認為這將是AI能量領域的鑰匙石。這是迄今為止最全面的分析。”
,但是,披露並非沒有其批評者和限制。丟失的關鍵信息是每天的查詢總數。沒有此事,計算該服務的總能源需求仍然是不可能的。
此外,Google的碳排放量為0.03 GCO2E的每個提示值依賴於“基於市場的”會計。該方法允許該公司從其足跡中減去其可再生能源購買,這是一個爭執的點。
這種會計方法先前曾在Google的年度環境報告之後受到Kairos獎學金等團體的批評。首席研究員弗朗茲·雷塞爾(Franz Ressel)認為:“基於市場的排放是對公司友好的指標,它掩蓋了污染者對環境的實際影響。”這場辯論強調了公司氣候會計的複雜而經常政治化的性質。
透明度的舉動是針對范圍內的全行業爭奪權的。隨著AI能源的需求升級,技術巨頭越來越多地對“牢固”清潔能源(如水力發電和核能)進行大量投資,以確保其數據中心的穩定,24/7的供應。
這一抽象的辯論有形後果,有明顯的後果,具有一些AI的AI項目,並在社區中抗議MEMPHIS,一個重要的一步,它還凸顯了對標準化的全行業報告的需求。作為薩沙·盧西安(Sasha Luccioni),AI和氣候研究人員的擁抱臉,