Mistral通過裁判模型進入AI推理競賽，但基準揭示了差距

總部位於巴黎的AI實驗室Mistral啟動了其第一個推理模型家族的“裁判官”，以解決複雜的多步驟解決問題的戰略性。這家著名的歐洲公司正在採用雙重釋放策略，並為開發人員提供開源版本，也是為企業客戶提供更強大的專有模型。進入高級AI推理領域的條目是對這家資金充足的公司的重要測試。

，首次亮相立即凸顯了在該行業最高級別競爭的激烈挑戰。最初的基準測試表明，雖然官員標誌著該公司向前邁出的一步，但其旗艦企業模型目前落後於OpenAI，Google和Anthropic等競爭對手的主要推理模型。雜誌媒體表現不佳的競爭對手在關鍵數學，科學和編碼評估方面的競爭對手，並且與Openai發布的O3-Pro相吻合，O3-Pro是其迄今為止最強大的推理模式。

該發佈在全球AI競賽中的至關重要的動態:即使是啟動超過110億歐元的企業，競爭超過了，在企業中籌集了超過歐元的競爭，可以進行全面的競爭，以實現良好的標準，這是一定的任務。 Mistral似乎押注，開源可訪問性，企業友好的功能和速度的結合可以在縮小性能差距的同時取得很大的市場份額。

”

開源和企業野心的雙重策略

Mistral正在繼續與官方家族進行簽名的雙管策略。對於開發人員社區，該公司已發布了Small Small，這是一種240億參數模型，可根據允許的Apache 2.0許可，用於從擁抱臉下載。這種開源模型加強了對可訪問性的承諾，足以運行消費級硬件，這是開發人員和研究人員的關鍵功能，而無需訪問大型數據中心。

同時，Mistral是針對具有功能更強大的裁判媒體的企業客戶的目標。根據該公司的官方定價頁面，企業型號的定價為每百萬美元輸入令牌2美元，每百萬個產量代幣5美元。 Mistral專門將模型的“可追溯推理”作為受監管行業的關鍵合規性功能，這是A

公司的發展步伐是由於其在其 ablime a a i _ _> ablime a a _> ablime a a i _> ablime a a _> ablime a a i _> a>基礎架構“而不是從先前的模型中提取知識。這種獨立的培訓過程在概括方面取得了強大的成果，模型表現出在直接訓練數據之外的任務上表現出色的能力。米斯特拉爾（Mistral）的論文指出，經過編碼的版本可以解決數學問題，結果它們歸因於“ RL的概括能力”。在其官方公告中，Mistral報導說，Aimer Medium在AIME 2024 MATH MATH和SCICACH基准上得分73.6％。儘管受人尊敬，但這個數字需要上下文。社區分析，並迅速指出，Mistral的比較是與較舊版本的較舊版本進行的，它是一個關鍵競爭對手的型號，是DeepSeek-R1的原始版本。相同的AIME基準測試，將裁判官的表現遠遠落後於當前的最新。這項現實檢查表明，Mistral可能會在不同的向量上競爭。該公司強調其模型在法語，德語，西班牙語和阿拉伯語等語言中的強大多種語言推理。

此外，米斯特拉爾（Mistral）在

這重點是開源參與，企業就緒工具和性能效率的務實平衡，定義了Mistral的當前路徑。裁判的啟動是對基準國王的直接挑戰，而是建立一個可持續和多功能的AI生態系統的估算的遊戲。核心問題是，這種戰略深度是否足以鞏固其作為全球頂級球員的地位，同時它繼續追求AI推理的絕對前沿的艱鉅工作。

Mistral通過裁判模型進入AI推理競賽，但基準揭示了差距

Published by All Things Windows on June 11, 2025

開源和企業野心的雙重策略

IT Info

Google DeepMind宣布颶風預測中的AI少校突破

IT Info

Microsoft 365:黑客濫用塞特工具，用於對80,000個用戶帳戶的廣泛攻擊

IT Info

Google vs.發行商:德國媒體要求AI概述13億歐元

Mistral通過裁判模型進入AI推理競賽，但基準揭示了差距

Published by All Things Windows on June 11, 2025

開源和企業野心的雙重策略

Related Posts

IT Info

Google DeepMind宣布颶風預測中的AI少校突破

IT Info

Microsoft 365:黑客濫用塞特工具，用於對80,000個用戶帳戶的廣泛攻擊

IT Info

Google vs.發行商:德國媒體要求AI概述13億歐元