這週的 AI 圈子依舊熱鬧非凡。從圖像生成的技術突破,到音樂產業的版權大和解,再到 Google 打算幫你省下打電話的時間,每一項更新都切實地影響著我們的工作與生活。
以下為大家整理了本週最值得關注的 AI 重點新聞。
1. FLUX.2:不只是圖像生成,更是視覺工廠
大家對 FLUX.1 的印象可能還停留在它對文字理解的精準度,但 Black Forest Labs 顯然沒打算停下腳步。他們剛發布了 FLUX.2,這一次的升級重點不在於「能畫圖」,而在於「能工作」。
FLUX.2 被設計用來處理真實世界的創意工作流程。這意味著什麼呢?它不再只是生成一張漂亮的圖片讓你發發社群媒體,而是能穩定地處理複雜的文字排版、精準還原品牌 Logo,甚至是在多張參考圖之間保持角色和風格的一致性。
對於設計師來說,這是一個大好消息。FLUX.2 支援高達 400 萬像素的編輯,細節保留度極高。Black Forest Labs 延續了他們的「Open Core」理念,將這種強大的能力開放給社群,讓開發者和創作者都能在這個基礎上進行更多實驗。如果你是視覺工作者,這個模型絕對值得你花時間研究。
2. Google 新功能:讓 AI 幫你打電話給店家
你是否有過這種經驗?想買某個特定商品,但不確定附近的店家有沒有現貨,又懶得一家一家打電話去問。Google 在美國推出的新功能「Agentic Calling」就是為了解決這個痛點。
這項功能運作方式很直覺。當你在 Google 搜尋商品並加上「附近」這類關鍵字時,如果看到「讓 Google 通話 (Let Google call)」的選項,點下去就對了。系統會先問你幾個簡單問題,確認你想找的具體規格,接著 Google 的 AI 代理就會自動撥打電話給附近的商家。
最棒的是,你不需要在電話那頭乾等。通話結束後,Google 會透過簡訊或電子郵件把結果整理給你,告訴你哪家店有貨、有沒有折扣。詳細資訊可以參考 Google 官方部落格。這項功能目前先在美國上線,但相信很快就會普及到其他地區。
3. 世紀大和解:華納音樂與 Suno 達成合作
音樂產業與 AI 的關係一直很緊張,版權官司更是打得不可開交。但 Warner Music Group (WMG) 與 Suno 最近宣布達成了一項具有里程碑意義的合作協議,這可能改變整個行業的遊戲規則。
雙方不只停止了訴訟,還建立了兩項重要交易。首先是授權協議,Suno 將推出「進階授權模型」,WMG 旗下的詞曲作者可以自願加入,而且藝術家對自己的聲音和作品擁有「一鍵開關」的控制權。如果不想被 AI 翻唱,系統會透過聲紋指紋技術自動攔截。
其次是商業模式的轉變。Suno 買下了 WMG 旗下的 Songkick 平台,並且調整了下載機制。未來,免費使用者只能線上播放,想下載音頻檔案必須成為付費會員。這不僅保護了版權,也建立了一個新的分潤池,讓藝術家能從 AI 生成中獲得收益。這場「打不過就加入」的戲碼,或許會成為未來 AI 與內容產業共存的範本。
4. 給開發者的指南:如何寫好 GitHub Copilot 的 Agent
GitHub Copilot 推出了自定義 Agent 的功能,這讓開發者可以打造專屬的 AI 助手。但問題來了,要怎麼寫才能讓 AI 真正聽懂你的需求?
GitHub 分析了超過 2500 個儲存庫,整理出了一份 Copilot 自定義 Agent 編寫指南。他們發現,成功的 agents.md 文件通常具備幾個特點:指令要明確、要在文件開頭就列出可執行的命令 (如 npm test)、並且要設定清晰的邊界 (例如「絕對不要修改 vendor 資料夾」)。
与其告訴 AI 「你是一個有用的助手」,不如具體告訴它「你是一個負責寫 React 測試的工程師,請使用 Jest 框架」。這份指南對於想要客製化自己開發流程的團隊來說,是非常實用的參考資料。
5. Anthropic 研究:AI 到底省了多少時間?
大家都在說 AI 能提高生產力,但具體是多少?Anthropic 發布了一份 AI 生產力研究報告,分析了 Claude 上的真實對話數據。
數據顯示,對於複雜的任務,AI 平均能節省約 80% 的時間。特別是在程式設計和法律相關的工作中,效率提升最為明顯。報告指出,原本人類需要 90 分鐘才能完成的工作,在 AI 的協助下大幅縮短。
不過報告也誠實地提到,這並沒有計算人類驗證 AI 產出內容所需的時間。儘管如此,這份數據還是提供了一個強有力的證據,說明 AI 在處理高強度知識工作時的潛力。
6. Google Assistant 即將退役,Gemini 全面接手
陪伴安卓用戶多年的 Google Assistant 語音助理確定要說再見了。Google 官方宣布,Google Assistant 將在 2026 年 3 月 31 日正式停止運作。
接棒的將是更強大的 Gemini。未來在 Android、Wear OS 甚至是智慧音箱上,都將由 Gemini 提供服務。這是一個必然的趨勢,畢竟在生成式 AI 的浪潮下,傳統的語音助理已經顯得力不從心。Google 已經開始引導用戶進行切換,過渡期將持續到 2026 年第一季。
7. 馬斯克的挑戰書:Grok 5 能在 2026 年打贏《英雄聯盟》嗎?
Elon Musk 最近又在 X 上立下了新目標。他希望 xAI 的 Grok 5 能在 2026 年擊敗《英雄聯盟》的人類頂尖戰隊。
這不是普通的 AI 對戰。Musk 設定了嚴格的條件:AI 只能像人類一樣透過鏡頭看螢幕 (不能直接讀取遊戲 API),而且反應速度和點擊頻率不能超過人類極限。這意味著 Grok 5 必須像人一樣「理解」遊戲畫面並做出戰術決策,而不僅僅是靠超快的手速作弊。如果成真,這將是通用人工智慧 (AGI) 在視覺理解和即時決策上的重大突破。
8. 提升 Gemini 3 Pro 表現的小技巧
最後來點技術乾貨。Hugging Face 的技術主管在 X 上分享了一個 Gemini 3 Pro 的優化技巧。
透過與 Google DeepMind 團隊的合作,他們發現只要優化系統指令 (System Instructions),就能讓 Gemini 3 Pro 在多項 Agent 基準測試中的表現提升約 5%。對於追求極致效能的開發者來說,這 5% 的提升可能就是專案成功與否的關鍵。
常見問題解答 (FAQ)
Q1: Google 的「Agentic Calling」功能在台灣能用嗎? 目前這項功能剛在美國推出,主要支援英語環境。Google 通常會先在特定市場測試,收集回饋後再逐步推廣到其他地區與語言。台灣用戶可能還需要再等等。
Q2: FLUX.2 是免費的嗎? FLUX.2 採用了 Black Forest Labs 的「Open Core」策略。這通常意味著核心模型權重會對社群開放 (可能允許非商業用途或研究用途),但針對企業級的 API 服務或特定進階功能可能會收費。建議關注他們的官方 GitHub 或平台以獲取最新的授權資訊。
Q3: 既然 WMG 和 Suno 合作了,我用 Suno 做歌還會有版權問題嗎? 這取決於你的使用方式。新的協議下,Suno 建立了付費下載機制和聲紋保護。如果你是免費用戶,通常僅限於個人欣賞或分享鏈接。如果你是付費生成且用於商業用途,Suno 會透過新的授權模式來釐清權利。但要注意,對於特定藝術家「禁止 AI 翻唱」的作品,系統會主動攔截,無法生成。
Q4: Google Assistant 停用後,我的智慧家電會受影響嗎? Google 會引導用戶遷移到 Gemini。Gemini 將會接管原本 Assistant 的控制功能。理論上,大多數支援 Google Home 的設備應該能無縫接軌,但具體操作體驗可能會因為 Gemini 的理解能力更強而有所改變 (通常是變更好)。


