AI日報|Google DiffusionGemma 四倍速革命、小米 MiMo Code 開源與 Anthropic 指數級政策倡議
生成速度狂飆四倍!Google 最新文字擴散模型、ChatGPT 介面改版與最新科技焦點總整理 人工智慧的發展腳步從未停歇。每天都有新技術推翻大眾的認知,不管是語言模型的生成方式,還是複雜程式碼的自動撰寫機制,科技的極限不斷被刷新。本文將盤點今日最值得關注的五大科技焦點,帶您一探 Google DiffusionGemma 的四倍速革命、ChatGPT 模型選擇器大升級,以及 Anthropic 面對指數級發展所提出的全新政策框架。 打破打字機魔咒!Google DiffusionGemma 文字生成的極速進化 你知道嗎?有時候看著螢幕上逐字跳出的生成文字,確實滿考驗耐心的。這顛覆了常理。傳統的自迴歸語言模型就像一台舊式打字機,只能由左至右、一個字一個字慢慢敲出來。這項由 Google 推出的 DiffusionGemma 四倍速文字生成技術 徹底打破了這個傳統邏輯。 很多人可能會問,這樣的效能躍升對硬體要求會不會極度嚴苛?其實不然。這項實驗性開放模型將生成模式從「打字機」直接升級成了「大型印刷機」。它採用了專家混合架構,也就是所謂的 MoE 設計,總共包含 260 億個參數。然而,在推論時它只需啟用 38 億個參數。這意味著經過量化處理後,它可以輕鬆塞進像 RTX 5090 這樣具備 18GB 顯示記憶體的消費級顯示卡中。這對許多依賴本機端硬體運算的開發者來說,絕對是一大福音。 背後的運作機制非常巧妙。模型捨棄了依序預測詞元的做法,改用區塊自迴歸多畫布取樣。簡單來說,它會先生成一片充滿隨機佔位符的「畫布」,接著同時對 256 個詞元的區塊進行去噪處理與完善。更厲害的是,這種雙向注意力的機制讓每一個詞元都能參考前後文,實現了即時的智慧自我修正功能。如果想掌握背後的完整技術細節,查閱這份 DiffusionGemma 開發者指南 會非常有幫助,或者也可以直接參考 官方說明文件 來進行擴散取樣的各項細部設定。 不再一頭霧水!ChatGPT 模型選擇器升級與運算資源的精準拿捏 緊接著剛剛提到的運算效能升級,接下來看看 OpenAI 的最新動態。對於每天重度依賴 ChatGPT 處理繁雜任務的使用者而言,挑選合適的思考模式有時會讓人感到一頭霧水。Adam Fry 在社群平台上宣布了 ChatGPT 模型選擇器的微調更新。官方考量到付費用戶對此功能的極大關注,特別花時間釐清了這次的改版細節。



