news

AI日報|Google DiffusionGemma 四倍速革命、小米 MiMo Code 開源與 Anthropic 指數級政策倡議

June 11, 2026
Updated Jun 11
1 min read

生成速度狂飆四倍!Google 最新文字擴散模型、ChatGPT 介面改版與最新科技焦點總整理

人工智慧的發展腳步從未停歇。每天都有新技術推翻大眾的認知,不管是語言模型的生成方式,還是複雜程式碼的自動撰寫機制,科技的極限不斷被刷新。本文將盤點今日最值得關注的五大科技焦點,帶您一探 Google DiffusionGemma 的四倍速革命、ChatGPT 模型選擇器大升級,以及 Anthropic 面對指數級發展所提出的全新政策框架。


打破打字機魔咒!Google DiffusionGemma 文字生成的極速進化

你知道嗎?有時候看著螢幕上逐字跳出的生成文字,確實滿考驗耐心的。這顛覆了常理。傳統的自迴歸語言模型就像一台舊式打字機,只能由左至右、一個字一個字慢慢敲出來。這項由 Google 推出的 DiffusionGemma 四倍速文字生成技術 徹底打破了這個傳統邏輯。

很多人可能會問,這樣的效能躍升對硬體要求會不會極度嚴苛?其實不然。這項實驗性開放模型將生成模式從「打字機」直接升級成了「大型印刷機」。它採用了專家混合架構,也就是所謂的 MoE 設計,總共包含 260 億個參數。然而,在推論時它只需啟用 38 億個參數。這意味著經過量化處理後,它可以輕鬆塞進像 RTX 5090 這樣具備 18GB 顯示記憶體的消費級顯示卡中。這對許多依賴本機端硬體運算的開發者來說,絕對是一大福音。

背後的運作機制非常巧妙。模型捨棄了依序預測詞元的做法,改用區塊自迴歸多畫布取樣。簡單來說,它會先生成一片充滿隨機佔位符的「畫布」,接著同時對 256 個詞元的區塊進行去噪處理與完善。更厲害的是,這種雙向注意力的機制讓每一個詞元都能參考前後文,實現了即時的智慧自我修正功能。如果想掌握背後的完整技術細節,查閱這份 DiffusionGemma 開發者指南 會非常有幫助,或者也可以直接參考 官方說明文件 來進行擴散取樣的各項細部設定。

不再一頭霧水!ChatGPT 模型選擇器升級與運算資源的精準拿捏

緊接著剛剛提到的運算效能升級,接下來看看 OpenAI 的最新動態。對於每天重度依賴 ChatGPT 處理繁雜任務的使用者而言,挑選合適的思考模式有時會讓人感到一頭霧水。Adam Fry 在社群平台上宣布了 ChatGPT 模型選擇器的微調更新。官方考量到付費用戶對此功能的極大關注,特別花時間釐清了這次的改版細節。

老實說,能夠掌握運算節奏與投入精力的平衡,對專業工作者來說非常重要。這次更新移除了使用率極低的「輕量思考」選項,並將選單設計得更加直覺。現在的清單包含了「即時」、「中等」、「高」、「極高」以及專為專業用戶打造的「Pro」模式。

這樣的分類方式,讓大家可以更輕鬆地針對不同難度的任務,選擇最理想的運算速度。官方也強調,這次改版特別採納了社群的意見回饋,確保高等級的思考模式能夠被輕易存取。若想查看詳細的更新日誌,大家可以前往 OpenAI 官方發布說明 一探究竟。

一秒創造新宇宙!Project Genie 權限大擴張打造無限虛擬世界

談完實用工具的更新,探索人工智慧的趣味性同樣令人心跳加速。Google Labs 釋出了一個好消息,那就是 Project Genie 的存取權限正式大幅擴張

這是一個極具實驗性質的原型系統,核心功能是讓使用者創造並探索無限多樣的虛擬世界。從今天開始,全球所有訂閱了 Google AI Ultra 5X 最新方案的成年用戶,都能夠親自體驗這個神奇的計畫。想像一下,只要輸入幾個簡單的指令,就能憑空建構出一個完整的虛擬環境。這項技術無疑為未來的遊戲開發與虛擬實境應用開啟了全新的大門,讓人充滿期待。

告別金魚腦!小米 MiMo Code 開源專注長週期任務的寫碼專家

在軟體工程領域,如何讓人工智慧持續保持長期的專注力,一直是個難解的謎題。小米的 MiMo 團隊近期開源了一款名為 MiMo Code:擴展至長週期任務的程式設計智能體。它建構於 OpenCode 之上,並採用 MIT 授權條款,其原始碼已上傳至 GitHub 供大眾免費使用。

你可能會好奇,當任務步驟破百時,模型不會因為資訊過載而失控嗎?這正是 MiMo Code 最核心的突破。當任務長度增加到數十甚至數百個步驟時,一般模型往往會出現失憶或方向偏移的窘境。MiMo Code 針對運算、記憶與進化這三個關鍵層面進行了徹底的改造。首先,在單輪推論上,它導入了平行取樣的「Max Mode」,每次會產生五個候選方案,再由系統挑選出最穩健的執行計畫。同時,它還具備獨立的完成度驗證機制,防止系統在尚未滿足條件時就提早宣佈任務結束,這點相當實用。

記憶管理也是它的一大亮點。系統被劃分為四個層級,包含對話階段記憶、專案知識記憶、全域偏好記憶以及完整的歷史紀錄。特別的是,主程式本身不負責記錄,這項繁雜的工作交由獨立的子智能體在背景執行,確保寫碼過程不受任何干擾。最後,透過定期的「夢境」與「萃取」機制,系統能自動整理過往經驗,將散落的筆記轉化為可重複使用的技能,讓它隨著時間推移變得越來越聰明。

踩下科技狂飆的煞車?Anthropic 拋出政策震撼彈應對指數級發展

看完各項技術突破,大眾必須回頭思考政策與監管層面的挑戰。隨著技術能力呈指數級別攀升,傳統的政策制定流程早已無法應付這樣的驚人速度。因此,Anthropic 發表了一篇名為 人工智慧指數發展政策 的重磅文章。

這篇文章提出了兩大核心政策框架。第一部分是先進人工智慧框架,主要針對具備強大能力的模型進行嚴格規範。該公司強烈主張,只要模型的運算量超過特定門檻,就必須交由具備資格的第三方機構進行強制測試,涵蓋網路安全、生物武器等潛在風險評估。甚至進一步建議政府應擁有阻擋危險模型部署的實質權限。

另一部分則是經濟政策框架。如果技術真的帶來了前所未有的生產力,許多勞工勢必會面臨失業危機。屆時,經濟挑戰將不再是如何促進成長,而是如何確保這份豐饒能被公平分享。這項框架試圖為各種程度的勞動市場動盪預作準備,確保科技的紅利能夠惠及所有人。這不僅是一份政策建議,更是對全人類未來生活方式的一種全面反思。

問與答

Q1:Google DiffusionGemma 號稱有 260 億個參數,為什麼還能塞進消費級顯示卡(如 RTX 5090)中執行? A: 因為它採用了「混合專家模型(MoE)」架構。雖然總參數高達 260 億,但在實際推論運算時,它只需啟用 38 億個有效參數。經過量化處理後,它的記憶體需求可降至 18GB 顯示記憶體(VRAM)以內,讓它能非常順暢地在 RTX 5090 這種消費級硬體上進行本機端高達 4 倍速的文字生成。

Q2:ChatGPT 最新的模型選擇器改版中,為什麼要移除「輕量思考」模式?現在還有哪些選項可以選? A: 根據官方團隊 Adam Fry 釋出的資訊,因為「輕量思考(thinking-light)」模式的使用率極低,不到付費用戶的 1%,為了讓介面更直覺、更容易掌握運算節奏,因此決定將其移除。更新後的選項包含:「即時 (Instant)」、「中等 (Medium)」、「高 (High)」、「極高 (Extra High)」以及包含標準與擴充選項的「Pro」模式。

Q3:如果我想體驗一秒創造虛擬世界的 Project Genie,目前有開放給一般人使用嗎? A: 有的!根據 Google Labs 的最新公告,Project Genie 的測試權限已經大幅擴張。只要是全球訂閱了最新「Google AI Ultra 5X」方案的成年(18 歲以上)用戶,現在就可以登入並親自體驗這個能憑空創造無限虛擬環境的實驗性計畫。

Q4:小米開源的 MiMo Code 如何解決 AI 在寫程式時,任務一旦變長就容易「金魚腦」的問題? A: MiMo Code 的解法是將「寫程式」和「做筆記」分工。它導入了獨立在背景運作的「寫入子智能體(checkpoint-writer subagent)」,並建立包含會話記憶、專案知識、全域偏好與歷史紀錄的四層級記憶系統。當上下文快取即將滿載時,系統會自動重建並只注入最關鍵的濃縮記憶,讓主模型能專注於當下的程式碼任務,順利完成破百步驟的長週期開發。

Q5:Anthropic 呼籲政府必須踩下煞車,但具體來說,他們認為「多強大的 AI 模型」才需要被強制監管? A: Anthropic 在其政策框架中給出了明確的量化門檻:如果該模型的訓練運算量超過 $10^{25}$ 浮點運算次數(FLOPs),或者開發該企業的 AI 相關營收超過 5 億美元、AI 研發投入超過 10 億美元。達到此標準的「前沿模型」就應該接受嚴格的第三方評估,以防範網路安全與生物武器等潛在的災難性風險。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.