AI日報｜Google DiffusionGemma 四倍速革命、小米 MiMo Code 開源與 Anthropic 指數級政策倡議

度狂飆四倍！Google 最新文字擴

升級，以及 Anthropic 面對指數級

接下來看看 OpenAI 的最新動態

。它建構於 OpenCode 之上，並採

碼已上傳至 GitHub 供大眾免費

news

AI日報｜Google DiffusionGemma 四倍速革命、小米 MiMo Code 開源與 Anthropic 指數級政策倡議

2026-06-11

生成速度狂飆四倍！Google 最新文字擴散模型、ChatGPT 介面改版與最新科技焦點總整理

人工智慧的發展腳步從未停歇。每天都有新技術推翻大眾的認知，不管是語言模型的生成方式，還是複雜程式碼的自動撰寫機制，科技的極限不斷被刷新。本文將盤點今日最值得關注的五大科技焦點，帶您一探 Google DiffusionGemma 的四倍速革命、ChatGPT 模型選擇器大升級，以及 Anthropic 面對指數級發展所提出的全新政策框架。

打破打字機魔咒！Google DiffusionGemma 文字生成的極速進化

你知道嗎？有時候看著螢幕上逐字跳出的生成文字，確實滿考驗耐心的。這顛覆了常理。傳統的自迴歸語言模型就像一台舊式打字機，只能由左至右、一個字一個字慢慢敲出來。這項由 Google 推出的 DiffusionGemma 四倍速文字生成技術徹底打破了這個傳統邏輯。

很多人可能會問，這樣的效能躍升對硬體要求會不會極度嚴苛？其實不然。這項實驗性開放模型將生成模式從「打字機」直接升級成了「大型印刷機」。它採用了專家混合架構，也就是所謂的 MoE 設計，總共包含 260 億個參數。然而，在推論時它只需啟用 38 億個參數。這意味著經過量化處理後，它可以輕鬆塞進像 RTX 5090 這樣具備 18GB 顯示記憶體的消費級顯示卡中。這對許多依賴本機端硬體運算的開發者來說，絕對是一大福音。

背後的運作機制非常巧妙。模型捨棄了依序預測詞元的做法，改用區塊自迴歸多畫布取樣。簡單來說，它會先生成一片充滿隨機佔位符的「畫布」，接著同時對 256 個詞元的區塊進行去噪處理與完善。更厲害的是，這種雙向注意力的機制讓每一個詞元都能參考前後文，實現了即時的智慧自我修正功能。如果想掌握背後的完整技術細節，查閱這份 DiffusionGemma 開發者指南會非常有幫助，或者也可以直接參考官方說明文件來進行擴散取樣的各項細部設定。

不再一頭霧水！ChatGPT 模型選擇器升級與運算資源的精準拿捏

緊接著剛剛提到的運算效能升級，接下來看看 OpenAI 的最新動態。對於每天重度依賴 ChatGPT 處理繁雜任務的使用者而言，挑選合適的思考模式有時會讓人感到一頭霧水。Adam Fry 在社群平台上宣布了 ChatGPT 模型選擇器的微調更新。官方考量到付費用戶對此功能的極大關注，特別花時間釐清了這次的改版細節。

老實說，能夠掌握運算節奏與投入精力的平衡，對專業工作者來說非常重要。這次更新移除了使用率極低的「輕量思考」選項，並將選單設計得更加直覺。現在的清單包含了「即時」、「中等」、「高」、「極高」以及專為專業用戶打造的「Pro」模式。

這樣的分類方式，讓大家可以更輕鬆地針對不同難度的任務，選擇最理想的運算速度。官方也強調，這次改版特別採納了社群的意見回饋，確保高等級的思考模式能夠被輕易存取。若想查看詳細的更新日誌，大家可以前往 OpenAI 官方發布說明一探究竟。

一秒創造新宇宙！Project Genie 權限大擴張打造無限虛擬世界

談完實用工具的更新，探索人工智慧的趣味性同樣令人心跳加速。Google Labs 釋出了一個好消息，那就是 Project Genie 的存取權限正式大幅擴張。

這是一個極具實驗性質的原型系統，核心功能是讓使用者創造並探索無限多樣的虛擬世界。從今天開始，全球所有訂閱了 Google AI Ultra 5X 最新方案的成年用戶，都能夠親自體驗這個神奇的計畫。想像一下，只要輸入幾個簡單的指令，就能憑空建構出一個完整的虛擬環境。這項技術無疑為未來的遊戲開發與虛擬實境應用開啟了全新的大門，讓人充滿期待。

告別金魚腦！小米 MiMo Code 開源專注長週期任務的寫碼專家

在軟體工程領域，如何讓人工智慧持續保持長期的專注力，一直是個難解的謎題。小米的 MiMo 團隊近期開源了一款名為 MiMo Code：擴展至長週期任務的程式設計智能體。它建構於 OpenCode 之上，並採用 MIT 授權條款，其原始碼已上傳至 GitHub 供大眾免費使用。

你可能會好奇，當任務步驟破百時，模型不會因為資訊過載而失控嗎？這正是 MiMo Code 最核心的突破。當任務長度增加到數十甚至數百個步驟時，一般模型往往會出現失憶或方向偏移的窘境。MiMo Code 針對運算、記憶與進化這三個關鍵層面進行了徹底的改造。首先，在單輪推論上，它導入了平行取樣的「Max Mode」，每次會產生五個候選方案，再由系統挑選出最穩健的執行計畫。同時，它還具備獨立的完成度驗證機制，防止系統在尚未滿足條件時就提早宣佈任務結束，這點相當實用。

記憶管理也是它的一大亮點。系統被劃分為四個層級，包含對話階段記憶、專案知識記憶、全域偏好記憶以及完整的歷史紀錄。特別的是，主程式本身不負責記錄，這項繁雜的工作交由獨立的子智能體在背景執行，確保寫碼過程不受任何干擾。最後，透過定期的「夢境」與「萃取」機制，系統能自動整理過往經驗，將散落的筆記轉化為可重複使用的技能，讓它隨著時間推移變得越來越聰明。

踩下科技狂飆的煞車？Anthropic 拋出政策震撼彈應對指數級發展

看完各項技術突破，大眾必須回頭思考政策與監管層面的挑戰。隨著技術能力呈指數級別攀升，傳統的政策制定流程早已無法應付這樣的驚人速度。因此，Anthropic 發表了一篇名為人工智慧指數發展政策的重磅文章。

這篇文章提出了兩大核心政策框架。第一部分是先進人工智慧框架，主要針對具備強大能力的模型進行嚴格規範。該公司強烈主張，只要模型的運算量超過特定門檻，就必須交由具備資格的第三方機構進行強制測試，涵蓋網路安全、生物武器等潛在風險評估。甚至進一步建議政府應擁有阻擋危險模型部署的實質權限。

另一部分則是經濟政策框架。如果技術真的帶來了前所未有的生產力，許多勞工勢必會面臨失業危機。屆時，經濟挑戰將不再是如何促進成長，而是如何確保這份豐饒能被公平分享。這項框架試圖為各種程度的勞動市場動盪預作準備，確保科技的紅利能夠惠及所有人。這不僅是一份政策建議，更是對全人類未來生活方式的一種全面反思。

問與答

Q1：Google DiffusionGemma 號稱有 260 億個參數，為什麼還能塞進消費級顯示卡（如 RTX 5090）中執行？ A：因為它採用了「混合專家模型（MoE）」架構。雖然總參數高達 260 億，但在實際推論運算時，它只需啟用 38 億個有效參數。經過量化處理後，它的記憶體需求可降至 18GB 顯示記憶體（VRAM）以內，讓它能非常順暢地在 RTX 5090 這種消費級硬體上進行本機端高達 4 倍速的文字生成。

Q2：ChatGPT 最新的模型選擇器改版中，為什麼要移除「輕量思考」模式？現在還有哪些選項可以選？ A：根據官方團隊 Adam Fry 釋出的資訊，因為「輕量思考（thinking-light）」模式的使用率極低，不到付費用戶的 1%，為了讓介面更直覺、更容易掌握運算節奏，因此決定將其移除。更新後的選項包含：「即時 (Instant)」、「中等 (Medium)」、「高 (High)」、「極高 (Extra High)」以及包含標準與擴充選項的「Pro」模式。

Q3：如果我想體驗一秒創造虛擬世界的 Project Genie，目前有開放給一般人使用嗎？ A：有的！根據 Google Labs 的最新公告，Project Genie 的測試權限已經大幅擴張。只要是全球訂閱了最新「Google AI Ultra 5X」方案的成年（18 歲以上）用戶，現在就可以登入並親自體驗這個能憑空創造無限虛擬環境的實驗性計畫。

Q4：小米開源的 MiMo Code 如何解決 AI 在寫程式時，任務一旦變長就容易「金魚腦」的問題？ A： MiMo Code 的解法是將「寫程式」和「做筆記」分工。它導入了獨立在背景運作的「寫入子智能體（checkpoint-writer subagent）」，並建立包含會話記憶、專案知識、全域偏好與歷史紀錄的四層級記憶系統。當上下文快取即將滿載時，系統會自動重建並只注入最關鍵的濃縮記憶，讓主模型能專注於當下的程式碼任務，順利完成破百步驟的長週期開發。

Q5：Anthropic 呼籲政府必須踩下煞車，但具體來說，他們認為「多強大的 AI 模型」才需要被強制監管？ A： Anthropic 在其政策框架中給出了明確的量化門檻：如果該模型的訓練運算量超過 $10^{25}$ 浮點運算次數（FLOPs），或者開發該企業的 AI 相關營收超過 5 億美元、AI 研發投入超過 10 億美元。達到此標準的「前沿模型」就應該接受嚴格的第三方評估，以防範網路安全與生物武器等潛在的災難性風險。

分享至:

Featured Partners

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

Recommended for You

A …

news

AI日報｜OpenAI展示ChatGPT Work、Stripe擬百億收購OpenRouter、GitHub Copilot桌面端發布

AI 日報 | 2026-07-27 💡 此文章是自動產生，每天早上九點自動更新。模型發布/更新 GigaChat Audio 10B — AI Sage 一言以蔽之：基於 GigaChat 3.1 打造的原生音訊大模型，具備強大的語音理解與時序定位能力。核心亮點：採用 Conformer 語音編碼器與 MoE 解碼器，保留文字能力的同時新增語音問答、長音訊時間戳記事件描述等功能。在自建的 TimeGround-1M 資料集上進行訓練，具備工具呼叫（Tool-use）能力。技術規格：10B 參數 / 開源模型 / MoE 架構傳送門：Hugging Face 展示產品發布/更新 ChatGPT Work 與 Voice 升級 — OpenAI 更新內容：Sam Altman 演示了 ChatGPT Work 新功能，使用者僅需透過一句手機語音指令，即可讓 AI 自動讀取歷史對話、規劃 8 人旅行方案、製作全端協作網站並起草邀請郵件。Voice 模式的升級，讓使用者能完全解放雙手控制電腦，催生了新型態的運算終端體驗。適用人群：一般大眾 / 辦公族 / 開發者體驗通道：chatgpt work is remarkable, and "work" undersells it. from my phone i sent: "use all my chat history to figure out ideas for a long weekend trip with 8 friends, plan the best three options, make a full-stack site where the 9 of us can coordinate on what we would want to do in…

Jul 27, 2026 Read →

A …

news

AI日報｜ChatGPT桌面端語音開放，FLUX 3同步生成影音，微軟發表MAI雙模型

AI日報｜ChatGPT桌面端語音開放，FLUX 3同步生成影音，微軟發表MAI雙模型今日重點語音助理大升級：OpenAI 把語音控制搬上桌面，Claude 則開始陪你用語音拆解複雜難題。 FLUX 3 多模態震撼登場：BFL 採用單一架構，同步生成高解析度影片、影像與原生音訊，打破影音生成極限。微軟發布 MAI 雙模型：MAI Image-2.5-Pro 終於搞定圖片裡的文字渲染，還能直接用白話文修圖。小模型發威：Ling-3.0-flash 與 KAT-Coder-V2.5-Dev 靠著混合專家（MoE）架構榨出驚人效能。工作流升級：Runway 推出幫你挑模型的「媒體路由器」，OpenAI Codex 終於支援跨資料夾協作。底層技術突破：PaddlePaddle 實現階層式平行文件解析，LLaDA2.2-flash 讓語言模型也能邊生成邊「修改」。技術名詞速覽 MoE（混合專家架構）：系統把模型拆成多個「專家」，每次生成只喚醒需要的少數參數，省算力又保證品質。階層式平行解碼（Hierarchical Parallel Decoding）：不再像以前那樣一個字一個字慢慢吐。主分支管全局排版，其他分支同時處理局部內容，解析長文件的速度直接翻倍。萊文斯坦編輯（Levenshtein Editing）：擴散語言模型的新機制。白話來說，模型在平行輸出的過程中，可以直接「插入」或「刪除」字元來抓蟲修正。重大新聞 1. 語音控制與個人健康數據的無縫結合用嘴巴寫程式、控制電腦，聽起來有點像早期的科幻片，但 OpenAI 剛把它搬進了 macOS 和 Windows 的桌面版。靠著 GPT-Live 的即時能力，你現在可以直接開口指揮背景的 Codex 幫忙處理專案。ChatGPT Voice is now in the desktop app. Control your computer and direct multiple agents running in ChatGPT Work or Codex, using just your voice. It's powered by GPT-Live, so it can speak, listen, and coordinate work in the app at the same time. Rolling out globally today… pic.twitter.com/ODZWKqecCf

Jul 24, 2026 Read →

A …

news

AI日報｜OpenAI 推出企業代理 Presence、微軟釋出輕量生圖 Mage-Flow、Cursor 上線智慧路由器

AI 快訊：OpenAI 推出企業代理 Presence、微軟釋出輕量生圖 Mage-Flow、Cursor 上線智慧路由器今日重點 OpenAI 推出企業級代理 Presence：將模型推理能力與嚴格的內部護欄綁定，試圖解決 AI 代理進入商業生產線的信任危機。微軟釋出 4B 輕量模型 Mage-Flow：捨棄傳統裁切法，以原生解析度訓練，用極低的硬體需求挑戰頂尖開源生圖系統。 Upstage 開源 250B 代理特化模型 Solar Open 2：專攻複雜工具調用與長文本處理，且只需兩張企業級 GPU 即可本地部署。科技巨頭撒幣支援基礎科學：Google 與 OpenAI 雙雙投入鉅資支援美國 Genesis 任務，Anthropic 則砸下兩億美元探討 AI 的社會與經濟衝擊。 Cursor 上線智慧路由器：自動在背景依據任務難度切換大中小型模型，幫開發團隊省下大筆 API 費用。為什麼你要在意過去一兩年，大家都在盯著哪家大廠能堆出參數量更暴力的語言模型。但最近風向變了。比起在跑分榜上稱霸，業界現在更關心這些「聰明的大腦」能不能真正在辦公室裡幹活。企業要的是能穩定執行 SOP 的系統，這正是近期專注於工作流程的 AI 代理（Agent）紛紛出籠的原因。與此同時，國家級的科學研究也開始大舉導入 AI 算力。這意味著技術落地已經跨過單純的「聊天對話」，進入解決真實世界複雜挑戰的深水區。看懂這波基礎設施與代理化趨勢，你才能掌握科技圈接下來的遊戲規則。技術名詞速覽 MoE（混合專家架構）：把大模型拆成多個專精不同領域的小專家。生成時只喚醒需要的那幾個，用極低運算成本換取大模型的推理品質。 NoPE（無位置編碼）：捨棄傳統的位置編碼，改用語境與線性注意力層的循環狀態來理解序列，這讓模型能處理超越訓練長度的超長文本。 Native-Resolution MMDiT（原生解析度多模態擴散變換器）：它能直接處理各種長寬比的原始圖像與文本，不用事先死板地裁切或補黑邊。重大新聞 1. OpenAI 讓企業不再苦惱：AI 代理 Presence 正式上線大家都知道 AI 代理潛力無窮，但真要讓它去改動公司資料庫或處理客戶帳單？沒幾家企業有這個膽量。OpenAI 新推出的 Presence 就是衝著這個「信任缺口」來的。

Jul 23, 2026 Read →

AI日報｜Google DiffusionGemma 四倍速革命、小米 MiMo Code 開源與 Anthropic 指數級政策倡議

生成速度狂飆四倍！Google 最新文字擴散模型、ChatGPT 介面改版與最新科技焦點總整理

打破打字機魔咒！Google DiffusionGemma 文字生成的極速進化

不再一頭霧水！ChatGPT 模型選擇器升級與運算資源的精準拿捏

一秒創造新宇宙！Project Genie 權限大擴張打造無限虛擬世界

告別金魚腦！小米 MiMo Code 開源專注長週期任務的寫碼專家

踩下科技狂飆的煞車？Anthropic 拋出政策震撼彈應對指數級發展

問與答

scribis.app

DMflow.chat

DMflow.chat

videoweaver.app

scribis.app

DMflow.chat

DMflow.chat

videoweaver.app

Recommended for You

AI日報｜OpenAI展示ChatGPT Work、Stripe擬百億收購OpenRouter、GitHub Copilot桌面端發布

AI日報｜ChatGPT桌面端語音開放，FLUX 3同步生成影音，微軟發表MAI雙模型

AI日報｜OpenAI 推出企業代理 Presence、微軟釋出輕量生圖 Mage-Flow、Cursor 上線智慧路由器

Leaving Website