MiniMax 是一家由阿里巴巴和騰訊支持的新加坡人工智慧新創公司,推出了一系列新的人工智慧模型,具有破紀錄的 400 萬個代幣上下文視窗。
MiniMax-Text-01 和 MiniMax-VL-01 的發布使該公司成為了成熟的競爭對手OpenAI和Google 等參與者為需要持續記憶體和廣泛輸入處理的應用程式提供了先進的功能。智慧的飛躍可擴展性和可負擔性。 MiniMax 的公告強調了其對AI 代理開發的關注,滿足對能夠擴展上下文處理的系統不斷增長的需求。 ;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==”>
MiniMax-Text-01 模型共有4560 億個參數,在推理過程中,每個代幣啟動了 459 億個。它專為高效的長上下文處理而設計,採用混合注意力機制,結合線性層和 SoftMax 層來優化可擴展性。該模型在訓練期間支援多達100 萬個令牌的上下文窗口,在推理中可擴展至令人印象深刻的400 萬個令牌。 https://en.wikipedia.org/wiki/Vision_transformer”>Vision Transformer (ViT) 模組,MiniMax-VL-01 模型專為多式聯運應用而客製化。它使用結構化的四階段訓練管道處理廣泛的5120 億個視覺語言令牌,確保在需要整合視覺和文字資料的任務中具有強大的性能。牌對人工智慧意味著什麼開發
人工智慧模型中的上下文視窗決定了它們可以同時處理多少信息,每個標記代表一個數據片段,例如單字或標點符號。
MiniMax-Text-01 400萬枚代幣容量大幅超越業界標準,包括OpenAI 的GPT-4(32,000 個代幣)和Google 的Gemini 1.5 Pro(200 萬個代幣)。於單本書中幾本書的資料量。
該公司在其 X 帳戶上表示,「MiniMax-01 可有效處理多達 400 萬個代幣,是其他領先型號容量的 20 至 32 倍。我們相信,隨著代理越來越需要擴展的上下文處理功能和持續內存,MiniMax-01 已準備好支持來年預期激增的代理相關應用程序。已推出開源:為人工智慧代理時代擴展閃電注意力
我們很高興推出我們最新的開源模型:基礎語言模型 MiniMax-Text-01 和視覺多模態模型 MiniMax-VL-01.
💪創新閃電關注…pic.twitter.com/LbJhhmxD4P
—MiniMax(官方) (@ MiniMax__AI) 2025 年1 月14 日
此功能打開了大門適用於研究分析、法律文件處理和人工智慧驅動模擬等領域的應用,這些領域必須處理大型資料集。.com/wp-content/uploads/2025/01/MiniMax-Text-01-vs-GPT-4o-Claude-3.5-Sonnet-DeepSeek-V3-Qwen2.5-72B-Instruct-Llama-3-70B-context-windows-1024×952.jpg”>圖片:MiniMax
MiniMax-01 背後的技術
MiniMax 新型號的核心在於其“閃電注意力架構”,即結合線性和“SoftMax”注意層的混合系統。與傳統的Transformer 模型不同,傳統的Transformer 模型計算複雜性隨輸入大小呈二次方擴展,Lightning Attention 實現了近線性的可擴展性,從而能夠高效處理長序列。該模型還整合了專家混合(MoE) 框架,由32 個子模型或「專家」組成,根據任務選擇性地激活。”>CUDA 核心最佳化 進一步增強模型的可擴展性和效率。
基準和效能
兩種MiniMax-01 模型都在業界標準基準上展示了具有競爭力的結果。
來源:MiniMax
在多模式任務中,MiniMax-VL-01 在視覺語言評估方面表現出色,在DocVQA 上的準確度為96.4%,在AI2D 基準上的準確度為91.7%。 .jpg”>來源:MiniMax
儘管取得了這些成就專家警告說,像大海撈針這樣的基準測試可能無法完全反映現實世界的應用程式。研究表明,雖然大的上下文視窗很有價值,但其有效性取決於它們的使用方式,尤其是在需要檢索增強生成(RAG) 的任務中。和有競爭力的定價
MiniMax 已在GitHub 和抱臉,以及透過其專有的Hailuo AI平台。
開發人員還可以透過 API 以極具競爭力的價格存取它們:每百萬個輸入代幣 0.20 美元,每百萬個輸出代幣 1.10 美元。這項定價大大低於OpenAI 的GPT-4 API,後者每百萬個輸入代幣收費2.50 美元。 AI/MiniMax-01/blob/main/LICENSE”>MiniMax 的許可包含限制。例如,每月活躍用戶超過1億的平台必須獲得特殊許可,且模型不能用於改善競爭對手的人工智慧系統。這些條件可能會限制大型企業的採用。
道德挑戰和監管環境
MiniMax 在訓練資料集中使用受版權保護的資料面臨持續的審查。中國串流服務愛奇藝已提起訴訟,指控該公司未經授權使用其錄音,而MiniMax 的Talkie 應用程式以人工智慧生成的公眾人物頭像為特色,因未具體說明的違規行為而於2024 年12 月從蘋果應用商店下架。/p>
這些問題隨著美國出口而出現。拜登政府宣布的新規定旨在限制向中國公司出售先進的人工智慧晶片和技術。這些措施可能會使MiniMax 獲取訓練和擴展其模型所需的硬體變得複雜。由前員工於2021 年創立商湯科技旗下的 MiniMax 迅速擴展了其產品組合,從文字和多模態模型到視訊產生器。其Hailuo AI 平台的Video-01 型號因其生成逼真視訊的能力而受到關注,尤其是在人類手部動作等領域表現出色,這是視訊生成的一個具有挑戰性的方面。 >雖然MiniMax 將自己定位為成本低廉的解決方案,但作為行業巨頭的有效替代品,其應對法律挑戰和監管障礙的能力將對其持續增長至關重要。