
DMflow.chat
廣告
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
近期,來自史丹佛大學和華盛頓大學的研究團隊成功訓練了一款名為 S1 的 AI 推理模型,訓練成本竟然低於 50 美元,且雲端計算資源需求極低。這項研究於上週五發表,結果顯示,S1 在數學與程式設計能力測試中,表現可與 OpenAI 的 O1 模型及 DeepSeek 的 R1 模型相提並論。更令人振奮的是,S1 的程式碼與數據已在 GitHub 公開,供研究人員自由使用。
圖片由gpt-4o 生成
研究團隊並未從零開始訓練 S1,而是基於現有的預訓練模型,透過「蒸餾技術」提取所需的推理能力。具體來說,他們使用了 Google Gemini 2.0 Flash Thinking 實驗模型進行蒸餾,這與上個月加州大學柏克萊分校研究人員訓練另一款 AI 推理模型的方式類似(該模型訓練成本約 450 美元)。
這個突破讓許多 AI 研究者感到興奮,因為它證明了即便沒有龐大資金,依然能夠推動 AI 技術進步。然而,這也引發了一個關鍵問題:如果任何人都能以低成本複製價值數百萬美元的 AI 模型,大型 AI 公司的競爭優勢究竟何在?
事實上,大型 AI 實驗室對這一趨勢並不樂見。OpenAI 甚至指控 DeepSeek 在模型蒸餾過程中,違規使用其 API 數據。S1 研究團隊則希望找到更簡單的方法來實現強大的推理能力,並提升「測試時運算擴展」能力,讓 AI 在回答問題前能花更多時間「思考」。這正是 OpenAI O1 模型的關鍵突破,DeepSeek 和其他 AI 實驗室也在嘗試不同的方法來複製這項技術。
S1 的研究顯示,即使使用相對較小的數據集,也能透過監督微調(SFT)方式有效蒸餾 AI 推理能力。與 DeepSeek 採用的大規模強化學習方法相比,這種方式成本更低、效率更高。此外,Google 目前允許研究人員免費存取 Gemini 2.0 Flash Thinking 實驗平台,但每日使用量有限,且禁止用於開發競爭性服務。
研究團隊為了訓練 S1,構建了一個包含 1,000 道精選數學題的資料集,並提供對應的答案與「思考過程」。整個訓練過程僅使用了 16 顆 Nvidia H100 GPU,耗時不到 30 分鐘。目前,研究人員甚至可以用 20 美元左右的租賃成本完成相同的訓練。此外,他們還巧妙地加入「wait」指令,強迫 AI 在回答前停頓,以提高回答準確率。
隨著 Meta、Google 和 Microsoft 計畫在 2025 年投資數千億美元打造 AI 基礎設施,這項低成本蒸餾技術的發展,無疑將對現有 AI 商業模式產生衝擊。雖然蒸餾技術已成功降低模型複製成本,但目前尚未顯示出能大幅提升新模型效能的跡象。
關鍵重點整理:
這項研究展示了,在精心策劃的數據與創新的推理技術支持下,即便是低成本 AI 模型,也能夠與頂級 AI 競爭。研究結果進一步證實,單靠大量數據並不足以提升 AI 推理能力,關鍵在於數據的多樣性與難度。此外,「測試時運算擴展」策略能有效控制 AI 的推理過程,提升最終回答的準確性。
S1 的出現,無疑為 AI 研究帶來新契機,也讓我們重新思考:當 AI 訓練成本大幅降低後,未來的 AI 創新將如何發展?
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
限時七天!Windsurf AI 震撼推出免費無限 GPT-4.1 試用,立即體驗頂尖 AI!(2025-0414-0421) AI 界的朋友們注意!Windsurf AI 宣布提供為期...
偷聽海豚說話?Google AI 神器 DolphinGemma 揭開海洋世界的溝通秘密 幾十年來,科學家們一直試圖解開海豚那複雜的「喀答聲」、「哨聲」和「脈衝聲」之謎。現在,Googl...
WordPress 放大絕!一句話打造專屬網站?AI 助手讓你跟架站煩惱說掰掰! 厭倦了複雜的網站架設流程?WordPress 推出革命性 AI 網站建置工具,只要一句話描述你的想法,A...
AI 智慧體大串連!Google 推出開源 A2A 協定,打造無縫協作新時代 厭倦了各自為政的 AI 工具嗎?Google 攜手 50 多家科技巨頭推出 Agent2Agent (A2A...
Llama 4 偷跑學習?Meta 高層駁斥作弊指控,揭開 AI 模型訓練的灰色地帶 Meta 最新 AI 模型 Llama 4 一推出就引發軒然大波!被指控在訓練過程中「作弊」以美化評...
Meta 震撼彈!開源 Llama 4 多模態 AI 登場,效能驚人挑戰 GPT-4! Meta 最新力作 Llama 4 系列 AI 模型正式開源!原生多模態、超長上下文、專家混合架構...
OpenAI推出結構化輸出功能:讓AI生成的JSON更加可靠 OpenAI在其API中新增了結構化輸出功能,大幅提升了AI模型生成有效JSON的可靠性。這項功能不僅讓開發者能更輕鬆地建立穩定的...
OpenAI Day3: 引領創新!Sora 產品發布會精彩回顧 活動簡介 歡迎辭與新產品亮相 第三天的活動拉開序幕,隨著 OpenAI 推出全新視訊產品 Sora,現場氣氛達到高潮!主持人熱...
SearchGPT 原型:AI 搜尋的新時代 OpenAI 正在測試 SearchGPT,這是一個結合 AI 模型和網絡信息的新搜尋功能原型。它旨在提供快速、及時的答案,並清晰地列出相關來源。...