中國人工智能初創公司MiniMax發布了新的開源模型。總部位於上海的 MiniMax 於週一推出了 MiniMax-M2。它的目標是在價格和功率上撼動人工智能市場。 MiniMax 表示 M2 可以與 Anthropic 的 Claude Sonnet 4.5 等頂級型號相媲美。然而,它的運行成本僅為 8%。

該模型是為人工智能代理和編碼而構建的。其智能設計僅使用 100 億個活動參數。這可以保持低成本和高速度。此次發布使 MiniMax 與西方巨頭和本土競爭對手 DeepSeek 直接競爭不斷增長的開發者市場。

性能和效率的新基準

在中國科技巨頭阿里巴巴和騰訊的支持下,MiniMax 將其 M2 模型定位為開源領域的新領導者。

模型的官方文檔。

它專注於代理任務(人工智能必須規劃、執行和驗證複雜的工作流程),瞄準軟件行業的一個重要增長領域,從簡單的對話式人工智能轉向可以獨立完成複雜任務的系統。

基準MiniMax-M2Claude Sonnet 4Claude Sonnet 4.5Gemini 2.5 ProGPT-5(思考)GLM-4.6Kimi K2 0905DeepSeek-V3.2SWE 工作台已驗證 69.4 72.7 * 77.2 * 63.8 * 74.9 * 68 * 69.2 * 67.8 * 多 SWE 工作台 36.2 35.7 * 44.3//30 33.5 30.6 SWE-bench 多語言 56.5 56.9 * 68//53.8 55.9 * 57.9 * 終端工作台 46.3 36.4 * 50 * 25.3 * 43.8 * 40.5 * 44.5 * 37.7 * 工件工作台 66.8 57.3* 61.5 57.7* 73* 59.8 54.2 55.8 BrowseComp 44 12.2 19.6 9.9 54.9* 45.1* 14.1 40.1* BrowseComp-zh 48.5 29.1 40.8 32.2 65 49.5 28.8 47.9* GAIA(僅限文本) 75.7 68.3 71.2 60.2 76.4 71.9 60.2 63.5 xbench-DeepSearch 72 64.6 66 56 77.8 70 61 71 HLE(帶工具) 31.8 20.3 24.5 28.4 * 35.2 * 30.4 * 26.9 * 27.2 * τ²-工作台 77.2 65.5* 84.7* 59.2 80.1* 75.9* 70.3 66.7 FinSearchComp-全球 65.5 42 60.8 42.6* 63.9* 29.2 29.5* 26.2 AgentCompany 36 37 41 39.3*/35 30 34

來源:MiniMax

獨立測試支持這些說法。 Artificial Analysis 的第三方基準測試將 MiniMax-M2 的整體智能水平排在全球​​​​前五名,得分為 61%。

這一排名領先於 Google Gemini 2.5 Pro 等競爭對手。 (60%),與 Anthropic 的 Claude Sonnet 4.5 (63%) 相當。

對於開發人員來說,這意味著可以使用強大的開放權重模型,該模型可以處理複雜的編碼和工具使用場景,而無需鎖定在專有的生態系統中。

“不可能的三角”:平衡功耗、速度和成本

多年來,開發者一直面臨模型的智能、推理速度和運營成本之間的權衡——一個“不可能三角”。

MiniMax 聲稱 M2 直接解決了這一挑戰。

“我們一直在探索是否有可能創建一個在性能、價格和速度之間實現更好平衡的模型,從而讓更多人受益於 Agent 時代的智能提升,”該團隊 博客文章中所述。

這種平衡的關鍵是模型的架構,它優先考慮節省計算而不犧牲能力。

通過建立在專家混合 (MoE) 架構的基礎上,M2 利用 一個包含 2300 億個總參數的龐大池,但根據其技術規範,對於任何給定任務只激活了 100 億個參數。

M2 比 DeepSeek 等競爭對手的模型要高效得多,DeepSeek 的每個令牌激活 370 億個參數。

這種架構選擇大大減少了計算開銷和內存需求,直接轉化為更低的運營成本和更快的響應時間。

Huging Face。

MiniMax 延續了 DeepSeek 等其他中國公司確立的趨勢,這些公司積極推行開源戰略,以建立社區、推動全球採用,並在激烈的中美科技戰中展開競爭。

開源為公司克服硬件限制提供了一條戰略前進道路,使他們能夠在創新和成本方面進行競爭。

這一策略使 MiniMax 與國內競爭對手直接競爭,這種競爭已經持續一段時間了。

今年早些時候,MiniMax 專門發布了 M1 模型,以挑戰 DeepSeek 在推理模型領域的主導地位,強調更加寬鬆的模型 Apache 2.0 許可證是一個關鍵的優勢。

M2 的發布進一步推動了這場競爭,目標是同一開發者社區,以更低的成本提供令人信服的卓越性能。

“MiniMax 的發布延續了 DeepSeek 在 2024 年底啟動的中國人工智能實驗室在開源領域的領導地位,並且 DeepSeek、阿里巴巴、Z AI 和 Moonshot 的持續發布也延續了這一領先地位。 AI”,指出人工分析。

該發布是該公司更大創新模式的一部分,該公司擁有多樣化的產品組合,其中包括視頻生成工具,並且之前已通過具有破紀錄功能的模型設定了基準 400 萬代幣上下文窗口。

MiniMax 對開源、高效模型的關注標誌著其旨在佔領重要市場份額的戰略推動。通過解決功耗、速度和成本之間的關鍵平衡,M2 模型不僅挑戰了既定秩序,而且為全球開發者提供了構建下一代人工智能驅動應用程序的強大新工具。

Categories: IT Info