每日 AI 科技焦點:Google 轉向新型代理工具,算力與創新應用的全面升級
你知道嗎?人工智慧的發展軌跡總是出人意料。昨天還備受矚目的技術,今天可能就被全新的解決方案取代。如今,各家科技巨頭無不卯足全力推陳出新。從 AI 代理工具的策略轉向,到底層硬體與網路架構的突破,再到創作者工具的革新,每一項進展都牽動著整個產業的脈搏。讓我解釋一下,今天的最新動態將如何影響未來的科技走向。
AI 代理工具的策略轉彎與再進化
事情是這樣的,網頁瀏覽 AI 曾被視為下一個重大突破。但計畫趕不上變化。Google 最近悄悄關閉了實驗性專案 Project Mariner,將相關技術與人員轉移至其他產品。這項技術原本旨在讓系統代替使用者瀏覽網頁並執行任務。但龐大的運算需求與偶發的精準度問題,讓這類工具的發展受到阻礙。大家可能會問,Project Mariner 關閉代表網頁瀏覽 AI 失敗了嗎?其實不然,這標誌著業界正將目光轉向類似 OpenClaw 風格的命令列控制工具。這類工具直接透過系統指令執行操作,穩定度與效率都有顯著提升。
Google 發言人證實,相關的電腦操作能力將整合至未來的代理策略中,例如即將推出的 Gemini Agent。無獨有偶,Anthropic 也推出了不需要開啟終端機的 Claude Cowork,而 Meta 則正在開發代號為 Hatch 的個人化助理。
不僅如此,軟體的學習能力也正迎來突破。當任務不斷重複,系統是否能從中記取教訓?Manus 推出的 Project 自動更新功能 正是著眼於解決這個痛點。這項全新功能可以將有價值的對話轉化為專案指令與檔案更新。當工作流程發生改變,Manus 能夠識別可重複使用的決策與模式,並提出更新建議。這意味著未來的每一個任務,都會比前一個執行得更好。團隊成員再也不必耗費時間反覆說明相同的上下文。
有人可能會好奇,Manus 會不會在未經批准的情況下偷偷更新專案?答案是否定的。所有的更新建議都需要經過使用者的明確授權。你或許還會想問,這跟單純上傳新檔案有什麼不同?上傳檔案只會改變原始素材,這項新功能則是讓系統理解更廣泛的上下文,包含指令與工作流程的變更。大家甚至可以隨時手動觸發審查,要求系統提出修改建議。
突破運算瓶頸的底層革命
老實說,有時候硬體技術聽起來很枯燥,但這正是支撐那些酷炫應用的基石。因應龐大的運算需求,Anthropic 最近宣布與 SpaceX 達成運算合作協議。伴隨這項合作而來的是 Claude 提高使用上限的公告。官方不僅將 Pro、Max 等方案的五小時速率限制直接翻倍,同時也大幅調升了 Claude Opus 模型的 API 速率限制。表面上看,這似乎讓大家有更多發揮空間。
不過,這裡有個值得思考的潛在矛盾點。雖然五小時的處理速率限制提高了,但官方在公告中並未明確表示長期的總限額(例如七天總額度)是否同步調升。如果長期額度維持原狀,這代表重度使用者會以更快的速度將基礎額度消耗完畢。當額度提早見底時,開發者勢必得購買更多的 API 額度來維持運作。這或許是 Anthropic 提升算力背後,一個相當高明的商業策略。
在另一端,OpenAI 正著手解決超級電腦網路的壅塞問題。當數以萬計的 GPU 同步運作時,只要有一筆資料延遲,就會引發骨牌效應。OpenAI 發布的 MRC 網路協定 便是應運而生。這項與 AMD、Broadcom、Intel、NVIDIA 及微軟等巨頭共同開發的多路徑可靠連接技術,能將封包分散至數百條路徑。就算部分網路節點故障,MRC 也能在微秒內繞過錯誤,大幅減少模型訓練時的停機時間。
提到模型訓練,開發者們永遠在追求更高的效率。Unsloth 與 NVIDIA 攜手合作 找出了拖慢 LLM 訓練的隱藏瓶頸。他們發現,當主要的數學運算達到極致後,GPU 往往會卡在元資料處理與記憶體複製等繁瑣環節。透過快取打包序列元資料以及雙緩衝區等技術,他們成功讓 Qwen3-14B 等模型的向前傳遞速度提升了超過 43%。這對需要頻繁微調模型的開發團隊來說,無疑是一大福音。
搜尋體驗升級與音樂創作的新火花
我們每天都在使用的搜尋引擎,同樣迎來了引人注目的更新。Google 正為旗下產品帶來更多元探索方式。Google 搜尋的生成式 AI 推出五項全新功能,讓找尋資料變得更加直覺。當你對某個主題感興趣時,系統不僅提供解答,還會積極建議延伸閱讀的角度。這項更新也讓大眾能更輕鬆地存取已訂閱的新聞來源,甚至可以直接從回覆中預覽社群論壇的真實經驗談。
另一方面,科技在藝術領域的應用也越發成熟。音樂創作者現在有了全新的得力助手。Google Labs 宣布 Flow Music 與全球藝術家發展公司 Believe 展開合作。這套由 Lyria 3 Pro 模型驅動的工具,能夠協助音樂人構思歌詞、嘗試新旋律,甚至創造全新的樂器音色。大家可能會擔心版權問題?Google 已經明確表示,他們不會宣稱擁有 Flow Music 生成的原創內容所有權。這項承諾無疑給了創作者一顆定心丸,讓科技真正成為激發靈感的催化劑。
問與答
Q1:為什麼 Google 要關閉 Project Mariner?未來的 AI 代理工具發展方向是什麼? A1: 網頁瀏覽 AI(如 Project Mariner)因為需要處理龐大的螢幕截圖與資訊,面臨龐大運算需求與偶發的精準度問題,導致發展受阻。目前業界正將目光轉向類似 OpenClaw 風格的命令列控制工具(例如 Claude Cowork 或 Meta 開發中的 Hatch),這類系統直接透過終端機指令控制電腦,執行任務的穩定度與效率都有顯著提升。
Q2:Manus 的 Project 自動更新功能,會不會在未經同意的情況下偷偷修改專案檔案? A2:不會。雖然 Manus 能夠從團隊的對話中學習,並將有價值的資訊轉化為專案指令、檔案或技能更新,但所有的更新建議都必須經過使用者的明確審查與授權。這確保了專案上下文只在人為批准後才會改變。
Q3:Anthropic 近期與 SpaceX 達成算力合作後,對使用者的額度有何具體影響? A3: 根據官方公告,Anthropic 藉由增加的算力容量,將 Pro、Max 等方案的「五小時速率限制」直接翻倍,並取消了尖峰時段的限制縮減。同時,開發者使用的 Claude Opus 模型 API 速率限制(每分鐘最大輸入與輸出 Token 數)也獲得了大幅度的提升。
Q4:OpenAI 的 MRC 網路協定如何解決超級電腦的網路壅塞問題? A4: 傳統的網路協定通常要求資料傳輸遵循單一路徑,容易導致封包碰撞與壅塞。MRC(多路徑可靠連接)顛覆了這個模式,將單次傳輸的封包分散(噴灑)至數百條網路路徑上。如果某條路徑發生故障或壅塞,MRC 可以在微秒內偵測並繞過錯誤,大幅減少模型訓練時的停機時間與延遲。
Q5:Unsloth 與 NVIDIA 合作,針對 LLM 訓練解決了哪些「隱藏瓶頸」? A5: 他們發現當主要的數學運算達到極致後,GPU 經常會卡在反覆的資料簿記與等待中。透過三項關鍵技術:快取打包序列元資料、使用雙緩衝區隱藏記憶體複製延遲,以及優化 MoE 路由模型,他們成功消除了這些隱藏瓶頸,將整體 GPU 訓練速度提升了約 25%。
Q6:音樂創作者如果使用 Google 的 Flow Music 生成音樂,會不會有版權爭議? A6:不會。Google 已明確承諾,他們不會宣稱擁有使用 Flow Music 所生成之原創內容的所有權。這套由 Lyria 3 Pro 驅動的工具旨在作為創意的協作者,協助藝術家構思歌詞、旋律或新樂器,讓創作者能安心保有自己的作品權益。


