tencent表示,它通過部署DeepSeek的AI模型來減少對NVIDIA GPU的依賴,從而減少芯片的效率更高,這一轉變描述為旨在降低硬件依賴性和提高可伸縮性的長期基礎設施策略。 href=“ https://www.mitrade.com/insights/news/live-news/article-8-707313-20250320“ target=“ _ blank”> Q4 2024收入呼叫公司強調公司在此處強調了公司的主要企業,該公司的競爭者是compant the Archtectect-the Commant the Commant the Compant the Commant the Commant the Commant tenent of the Commant tience the Commant tenent tence

能夠在保持產出的同時最大程度地減少GPU消耗。高管說:“行業和行業中,我們在現有GPU的大型語言模型培訓中的生產力要高得多,而無需以先前預期的速度增加額外的GPU。”他進一步解釋了:

“中國公司通常優先利用效率和有效地利用了GPU的效率,並且不需要Indimation Indimation Indimation Indimation Inmimate Infrimate and Imprimation and Imprimation and Imprimation and Insversion。思考DeepSeek的成功確實象徵著-證明了這一現實。採購。

效率超出規模:為什麼騰騰要支持DeepSeek

DeepSeek的即將到來的R2模型現在是快速啟動 多模式功能,增強了其在企業用例中的實用性。

諸如DeepSeek的新型型號不僅更輕,而且更輕。它們還針對騰訊的計算堆棧進行了優化,使其在培訓和推理期間都提高了效率。

,而公司還投資於內部開發(例如其Hunyuan Turbo s模型),Deepseek被用於更複雜的工作負載,需要更複雜的工作量,需要進行高級推理和交叉語言績效。實際上,據報導,該公司已大量的NVIDIA中國特定的H20芯片,以支持跨微信等應用程序的DeepSeek集成,如此

更聰明地縮放:與OpenAI的GPT-4.5

對比,隨著其他科技公司的大規模下降,這種轉變也是如此。 2月,OpenAI介紹了GPT-4.5,稱其為迄今為止最大,最有能力的型號。

但首席執行官山姆·阿爾特曼(Sam Altman)淡化了期望,

該模型在多語言和多模式任務中提高了性能,但在結構化領域(如數學和科學邏輯)中,

行業反應(分析師詢問Openai的持續擴展策略是否足夠回報),在諸如數學和科學邏輯之類的結構域中的特定於O3-Mini(例如O3-Mini)都無法表現出較小的特定於推理的模型。這表明了Tencent的方法(專注於推理效率和本地量身定制的模型)如何脫穎而出。最近的一項研究論文提出了一種稱為“樣本,仔細檢查和尺度”的方法,該方法通過推理時間自我驗證來改善推理。

模型每個查詢產生多個輸出,並使用內部評分機制選擇最準確的。儘管這增加了運行時的計算間接開銷,但它避免了預訓練大規模模型的激烈成本,並且被視為一種更具針對性的方法來改善推理任務。

雖然DeepSeek尚未確認它是否使用此類技術,其在推理基準中是否具有較高的基準和低的GPU培訓訓練足跡,因此可以採用類似的策略。對於Tencent而言,這提供了擴展AI服務的途徑,而不會過度承諾有限或受限的GPU庫存。

Microsoft的CoreWeave Exit突顯了更廣泛的偏移

tencent在重新評估其基礎結構時並不是一個人。 Microsoft最近與CoreWeave拒絕了120億美元的GPU Cloud Option,而是由Openai採用。這筆119億美元的交易包括Openai在Coreweave的IPO之前的3.5億美元股權。此舉使Openai可以使其計算源超過Microsoft Azure。該公司還正在縮減物理擴展。修改了內部需求預測後,微軟取消了多個AI數據中心租賃,包括威斯康星州的33億美元設施。 TD Cowen分析師指出,更新的OpenAi用法預測在決定中起著重要作用。

這種策略中的這種差異(Openai競賽(Openai)進行了更多的外部計算,而Microsoft和其他公司(如Tencent)和其他公司(如Tencent)和其他公司的內部管道更加流行化,使中國的成本更廣泛地不滿意,

DeepSeek的崛起也非常適合中國更廣泛的AI戰略。為了應對美國對高級芯片的出口限制,許多中國科技公司正在轉向開源模型。

這種方法可以更快地迭代,鼓勵全球採用並降低培訓成本。對於Tencent,採用DeepSeek更開放,更具成本效益的模型與這些國家和運營優先級相一致。 Target=“ _ Blank”>“ Sputnik Moment” 在美國AI行業中,首次亮相後,其1萬億美元短暫刪除了全球科技股票估值。

,而DeepSeek模型的長期可行性將取決於現實的績效,規模,規模和法規審查,趨勢是無效的。中國開發人員正在使用較少的芯片和更少的資本建立功能強大的AI模型,這僅基於規模和計算來挑戰傳統的成功模型。

有警告。儘管GPU使用率總體上減少,但Tencent不得不購買大量NVIDIA的H20芯片才能保持服務交付。這些模型仍然需要強大的後端硬件,並且在美國正在進行的限制下,中國維持供應能力仍然不確定。

即使如此,騰訊的策略也發出了明顯的信號。效率而不是擴展已成為新標準。隨著全球科技公司評估規模的成本和供應鏈的脆弱性,諸如DeepSeek R2之類的模型提供了不同的藍圖:較小,更智能,可能更可持續。

Categories: IT Info