多年來,假設純粹的計算能力將使它們保持領先地位,那麼人工智能研究一直由將數十億美元投入大量AI模型的公司主導。但是,斯坦福大學和華盛頓大學的一個新項目都在挑戰這種信念。

他們的最新模型S1接受了不到50美元的計算成本的培訓

與需要廣泛的基礎設施和幾個月培訓的專有模型不同,S1在30分鐘內僅使用16個NVIDIA H100 GPU進行了微調。

/p>

已經通過一個開放式github repository ,任何人都可以訪問任何人檢查,複製或改進。該項目對AI行業提出了一個關鍵的問題:在最高級別的競爭中仍然需要數十億美元的預算?

一種使OpenAI和Google的AI策略處於風險的模型

AI巨頭,例如OpenAI,Google和Microsoft,他們在AI模型培訓和基礎設施中都超過了競爭對手的能力。

OpenAI的O1型號和Google的Gemini 2.0 Flash設計有這種優勢。但是,S1的開發證明,高級推理能力可以以成本的一小部分複制。

S1背後的研究團隊使用了一種稱為蒸餾的技術,其中較小的模型經過培訓以模仿響應的響應

而不是從頭開始開發AI模型,他們採用了QWEN2.5-32B-Instruct,這是來自阿里巴巴的QWEN AI實驗室的免費可用模型數學和推理問題。

值得注意的是,數據集是使用Google的Gemini 2.0 Flash思維實驗模型生成的。如 S1研究論文,“我們構造S1K從雙子座思考實驗中蒸餾出的痕跡和答案。”

相關: Google釋放Gemini 2.0 Pro實驗和新2.0 Flash-Lite AI模型

而Google提供免費訪問此模型,其服務條款禁止使用其輸出來開發競爭AI模型。模型

儘管在相對較小的數據集上進行了培訓,但S1的性能水平與OpenAI和DeepSeek的模型相當。

在AIME24基准上,該基準測量了AI數學問題-解決能力,S1的精度得分為56.7%,超過OpenAI的O1-preview,在Math500基准上,S1的得分為44.6%,S1達到了93 %的精度,與DeepSeek R1的結果相匹配。

,該模型在更廣泛的科學知識中顯示出一些局限性。在包含高級物理,生物學和化學問題的GPQA-DIAMOND基准上,S1得分為59.6%,落後於OpenAI和Google的型號。

隨著S1的新興項目,公司越來越有可能實施水印技術或法律限制,以防止其AI生成的產出用於培訓其他系統。但是,在開源AI研究環境中執行這些規則將非常困難。

AI的未來:開放研究或公司控制?

AI研究繼續前進,開源創新與專有AI開發之間的鬥爭變得越來越激烈。蒸餾AI模型(例如S1和

主要的AI公司認為,專有模型可以更好地控制AI風險,確保安全,降低偏見和法規合規性。但是獨立研究人員反對說開源模型提高透明度,使專家可以審核和完善沒有公司影響的AI系統。

政府和監管機構也密切關注這些發展。迄今為止,AI決策集中在管理大型模型上,但是低成本AI複製技術的出現可能會將對話轉移到數據訪問限制和道德考慮上。

S1信號的釋放是一種轉變,這是一種轉變可以重塑AI行業。如果可以以低於50美元的價格複製強大的推理AI,那麼較小的AI研究團隊和初創企業可能很快就有能力與數十億美元的AI公司競爭。

目前, S1仍然是開放式的,這意味著全世界的研究人員可以測試,修改和擴展其功能。但是,如果OpenAI,Google和其他AI實驗室將其視為威脅,那麼他們可能會推動更嚴格的API訪問控件,許可限制,甚至針對AI蒸餾方法進行法律行動。

將未來定義未來通過公司控制的,專有的模型,或者將開放AI研究繼續前進,使所有人都可以訪問高級AI?在評論中讓我們知道您的想法。