法國人工智能公司Mistral AI推出了小型3,這是一種240億個參數大語模型(LLM),設計為本地的,開源的替代品,替代了OpenAI的GPT-4O Mini。<<<<<<<<<<<<<<<<<

該公司將小3定位為一種高效的模型,可針對快速,準確的響應進行了優化,能夠在具有32GB RAM的標準MacBook上運行,從而使其範圍更廣泛。

啟動與艾倫學院(Alen Institute for Allen Institute for Allen Institute for Allen Institute for Ai2)釋放tülu3 405b ,一種自定義的元版Llama 3.1的自定義版本,強調了AI部門在AI部門的持續發展的強度。新版本是在Mistral AI確認首次公開募股計劃並將其運營擴展到亞太地區的時候。

針對速度和效率進行了優化

mistral ai小型3與速度和可及速度的關注區分開來。與許多較大的型號不同,小3具有較少的層,這特別減少了處理時間。這種設計使其可以與Meta的Llama 3.3 70B和Alibaba的QWEN 32B等型號進行表現,但潛伏期明顯降低。

MISTRAL AI報告說,小型3在MMLU基準測試上達到了超過81%的精度,這是測量各種受試者語言模型準確性的測試,而無需使用強化學習或合成數據。

性能基準

在內部評估中,Mistral Small 3展示了與較大模型相當的輸出質量,例如Llama 3.3 70B,同時達到了明顯更快的響應時間。

此外,它比OpenAI的GPT-4O Mini表現出更高的輸出質量和更低的潛伏期。 Mistral報告說,該模型可以在量化時在單個RTX 4090或具有32GB RAM的MacBook上操作。

量化是一種降低AI模型中使用數字的精度的技術,使它們能夠在計算能力較小的設備上運行。這使得它非常適合在處理敏感數據的同時需要本地推理的業餘愛好者和組織。

模型的功能將其定位為諸如快速響應對話輔助,低延遲功能執行以及對特定特定的仔細調查之類的用途。主題領域。

測試表明,它超過了眾多基準測試的原始Llama模型的性能。

小型3

<的實際應用P> Mistral視圖小3作為用於許多生成AI任務的多功能解決方案,需要快速可靠的說明。根據Mistral的說法,客戶正在評估各種應用程序的模型,例如金融服務中的欺詐檢測,醫療保健中的客戶分類以及機器人和製造業中的設備命令和控制。

Mistral的研究人員在A 博客文章那個-訓練和指導的模型滿足了生成AI任務的“ 80%”的模型-這種效力需要強大的語言和指導性能,並且潛伏期很低。外部應用程序。

開源可訪問性

Mistral AI和Allen AI研究所同時發布開源模型AI開發的小型3號允許其免費使用,修改和部署。培訓過程。強化學習可以增強模型解決數學問題等任務的能力。

戰略定位

這些模型的發布發生了全球AI行業。 曾在接受彭博社的採訪中說,“我們不出售”,因為該公司追求獨立和全球增長,因為它已經確認了首次公開募股的計劃,並將其業務擴展到亞太地區。 140億參數模型以其在推理任務中的強勁性能而聞名。數學推理。朝著更小,更有效的模型的方向是由理解AI模型的縮放不是實現真實推理和理解的唯一因素, Meta的Yann Lecun突出顯示

Categories: IT Info