低成本 AI 推理模型 S1 震撼登場

近期,來自史丹佛大學和華盛頓大學的研究團隊成功訓練了一款名為 S1 的 AI 推理模型,訓練成本竟然低於 50 美元,且雲端計算資源需求極低。這項研究於上週五發表,結果顯示,S1 在數學與程式設計能力測試中,表現可與 OpenAI 的 O1 模型及 DeepSeek 的 R1 模型相提並論。更令人振奮的是,S1 的程式碼與數據已在 GitHub 公開,供研究人員自由使用。

低成本 AI 推理模型 S1 震撼登場

圖片由gpt-4o 生成


低成本、高效能:S1 是如何做到的?

研究團隊並未從零開始訓練 S1,而是基於現有的預訓練模型,透過「蒸餾技術」提取所需的推理能力。具體來說,他們使用了 Google Gemini 2.0 Flash Thinking 實驗模型進行蒸餾,這與上個月加州大學柏克萊分校研究人員訓練另一款 AI 推理模型的方式類似(該模型訓練成本約 450 美元)。

這個突破讓許多 AI 研究者感到興奮,因為它證明了即便沒有龐大資金,依然能夠推動 AI 技術進步。然而,這也引發了一個關鍵問題:如果任何人都能以低成本複製價值數百萬美元的 AI 模型,大型 AI 公司的競爭優勢究竟何在?

事實上,大型 AI 實驗室對這一趨勢並不樂見。OpenAI 甚至指控 DeepSeek 在模型蒸餾過程中,違規使用其 API 數據。S1 研究團隊則希望找到更簡單的方法來實現強大的推理能力,並提升「測試時運算擴展」能力,讓 AI 在回答問題前能花更多時間「思考」。這正是 OpenAI O1 模型的關鍵突破,DeepSeek 和其他 AI 實驗室也在嘗試不同的方法來複製這項技術。


蒸餾技術與「測試時運算擴展」

S1 的研究顯示,即使使用相對較小的數據集,也能透過監督微調(SFT)方式有效蒸餾 AI 推理能力。與 DeepSeek 採用的大規模強化學習方法相比,這種方式成本更低、效率更高。此外,Google 目前允許研究人員免費存取 Gemini 2.0 Flash Thinking 實驗平台,但每日使用量有限,且禁止用於開發競爭性服務。

研究團隊為了訓練 S1,構建了一個包含 1,000 道精選數學題的資料集,並提供對應的答案與「思考過程」。整個訓練過程僅使用了 16 顆 Nvidia H100 GPU,耗時不到 30 分鐘。目前,研究人員甚至可以用 20 美元左右的租賃成本完成相同的訓練。此外,他們還巧妙地加入「wait」指令,強迫 AI 在回答前停頓,以提高回答準確率。


大型 AI 公司的反應與未來趨勢

隨著 Meta、Google 和 Microsoft 計畫在 2025 年投資數千億美元打造 AI 基礎設施,這項低成本蒸餾技術的發展,無疑將對現有 AI 商業模式產生衝擊。雖然蒸餾技術已成功降低模型複製成本,但目前尚未顯示出能大幅提升新模型效能的跡象。

關鍵重點整理:

  • S1 模型訓練成本低於 50 美元,推理能力與頂尖模型相當。
  • 研究團隊透過蒸餾技術,快速高效地萃取推理能力,避免高昂的訓練費用。
  • 大型 AI 企業對低成本模型複製感到憂慮,未來的競爭焦點可能轉向 AI 基礎設施。

結論:S1 代表了 AI 研究的新可能性

這項研究展示了,在精心策劃的數據與創新的推理技術支持下,即便是低成本 AI 模型,也能夠與頂級 AI 競爭。研究結果進一步證實,單靠大量數據並不足以提升 AI 推理能力,關鍵在於數據的多樣性與難度。此外,「測試時運算擴展」策略能有效控制 AI 的推理過程,提升最終回答的準確性。

S1 的出現,無疑為 AI 研究帶來新契機,也讓我們重新思考:當 AI 訓練成本大幅降低後,未來的 AI 創新將如何發展?

參考論文

Share on:
Previous: Mistral AI 正式推出 iOS 和 Android 版 Le Chat,能撼動 ChatGPT 的地位嗎?
Next: Google 推出數位浮水印功能,確保 AI 編輯圖片的透明度
DMflow.chat

DMflow.chat

廣告

DMflow.chat:智能客服新世代!支援持久記憶、客製欄位,無需額外串聯即可輕鬆連接資料庫表單,整合多平台溝通,助您高效提升服務與行銷效率!

開發者們,準備好了嗎?Trae AI 編程工具正式登陸 Windows x64
18 February 2025

開發者們,準備好了嗎?Trae AI 編程工具正式登陸 Windows x64

開發者們,準備好了嗎?Trae AI 編程工具正式登陸 Windows x64! 字節跳動旗下的 AI 編程工具 Trae,終於迎來眾所期盼的 Windows x64 版本!對於長期苦於...

Perplexity 免費推出 Deep Research 工具:科技人員的研究利器
18 February 2025

Perplexity 免費推出 Deep Research 工具:科技人員的研究利器

Perplexity 免費推出 Deep Research 工具:科技人員的研究利器 你聽說了嗎?Perplexity AI 最近搞出大新聞——他們推出了一款名為 “Deep Resea...

OpenAI GPT-4o 悄然升級,AI 技術競賽再掀波瀾
18 February 2025

OpenAI GPT-4o 悄然升級,AI 技術競賽再掀波瀾

OpenAI GPT-4o 悄然升級,AI 技術競賽再掀波瀾 你發現了嗎?OpenAI 最近對旗下的 ChatGPT 進行了重要升級,最新版本 GPT-4o 再度成為業界焦點。這一消息由...

Elon Musk 與 xAI 正式發布 Grok3:以思維鏈推理技術引領新一代 AI 革新
18 February 2025

Elon Musk 與 xAI 正式發布 Grok3:以思維鏈推理技術引領新一代 AI 革新

Elon Musk 與 xAI 正式發布 Grok3:以思維鏈推理技術引領新一代 AI 革新 Elon Musk 所屬的 xAI 正式推出最新 AI 模型 Grok3,此次發布聚焦於技術...

馬斯克宣布 Grok3 即將發布,聲稱將超越 ChatGPT
13 February 2025

馬斯克宣布 Grok3 即將發布,聲稱將超越 ChatGPT

馬斯克宣布 Grok3 即將發布,聲稱將超越 ChatGPT 在最近於杜拜舉行的世界政府峰會(World Government Summit)上,億萬富翁科技企業家伊隆·馬斯克(Elon...

AI 對勞動市場的影響:現實數據解析
13 February 2025

AI 對勞動市場的影響:現實數據解析

AI 對勞動市場的影響:現實數據解析 人工智慧(AI)正在重塑我們的工作方式。過去,許多討論 AI 與就業市場的文章充滿推測與預測,但我們現在有了更具體的數據來了解 AI 如何在不同職業...

FACTS Grounding 評測基準:突破性驗證 AI 模型事實準確度的革新方案
20 December 2024

FACTS Grounding 評測基準:突破性驗證 AI 模型事實準確度的革新方案

FACTS Grounding 評測基準:突破性驗證 AI 模型事實準確度的革新方案 文章摘要 在 AI 發展突飛猛進的時代,大型語言模型(LLM)的事實準確性一直是業界關注的焦點。最新發布的...

OpenAI Day9: 向全球開發者致敬:提升開發者體驗
18 December 2024

OpenAI Day9: 向全球開發者致敬:提升開發者體驗

OpenAI Day9: 向全球開發者致敬:提升開發者體驗 開場介紹 歡迎致辭 by Olivia Gar Olivia Gar,OpenAI 的平台產品負責人,以滿滿的熱情開啟了第九天的活動...

Google突破性發布Veo 2與Imagen 3:AI影像生成的新紀元
19 December 2024

Google突破性發布Veo 2與Imagen 3:AI影像生成的新紀元

Google突破性發布Veo 2與Imagen 3:AI影像生成的新紀元 文章摘要 Google DeepMind最新發布的Veo 2視頻生成模型和Imagen 3圖像生成模型,將AI創作推向...