老實說,這幾天的 AI 發展讓人目不暇給。如果說前陣子我們還在討論 AI 聊天機器人有多聰明,那麼現在焦點已經完全轉移到了「實幹型」的 AI 代理(Agents)身上。
從 Google 讓每個人都能打造自己的辦公室小幫手,到 Anthropic 與 Snowflake 的巨額合作,甚至是 Kiro 推出的動態知識加載技術,這一切都在告訴我們:AI 不再只是陪聊,而是真的要動手處理那些繁瑣的工作流程了。準備好看看今天的重磅消息了嗎?讓我們直接切入正題。
Google Workspace Studio:不用寫程式也能打造你的 AI 員工
這絕對是今天最值得關注的消息之一。Google 正式宣布推出 Workspace Studio,這是一個讓企業用戶在 Google Workspace 內部直接建立和管理 AI 代理的平台。
你知道最棒的是什麼嗎?它完全不需要你會寫程式。
透過 Gemini 3 模型的強大推理能力,Workspace Studio 允許使用者用自然語言描述任務,然後 AI 就會自動生成一個能處理多步驟流程的代理人。這不是簡單的「幫我寫封郵件」,而是更複雜的邏輯。例如,你可以設定一個代理人:「如果收到包含問題的郵件,就把它標記為『待回覆』,並在 Chat 中通知我」。
這些代理人能直接存取 Gmail、Drive 和 Docs,理解你的工作脈絡。對於那些長期被行政雜務淹沒的人來說,這簡直是救星。Google 甚至分享了一個案例:清潔設備大廠 Kärcher 利用這套系統,將原本需要數小時的專案提案起草時間,縮短到了僅僅兩分鐘。
目前這項功能將在未來幾週內逐步推向商業用戶。如果你一直覺得現有的自動化工具太過僵化,那麼 Workspace Studio 帶來的靈活性可能會讓你耳目一新。
企業級 AI 的重磅交易:Anthropic 與 Snowflake 的 2 億美元合作
當大家還在關注消費級 AI 產品時,企業端的佈局正在悄悄改變遊戲規則。Anthropic 宣布與 Snowflake 擴大合作,這不僅僅是一紙合約,更是一筆價值 2 億美元的戰略聯盟。
這場合作的核心在於解決企業最頭痛的問題:數據在 Snowflake 裡,但 AI 模型在外面。
現在,透過 Snowflake 的 Cortex AI,企業用戶可以直接在受控的數據環境中調用 Claude 模型。這意味著你不需要把敏感數據搬來搬去,就能利用 Claude 的推理能力來分析數據。根據 Snowflake 的內部測試,Claude 在處理複雜的文字轉 SQL(Text-to-SQL)任務上,準確率超過了 90%。
此外,雙方還將致力於開發「AI 代理」,讓這些智能體能跨越結構化與非結構化數據進行分析。對於金融、醫療這些對數據安全極度敏感的行業來說,能在不出家門的情況下使用頂尖 AI 模型,絕對是一大誘因。
Amazon Nova 2 Lite:追求性價比的推理新選擇
在模型大戰中,Amazon 也沒閒著。AWS 剛剛發布了 Amazon Nova 2 Lite,這是一款主打「快速」與「高性價比」的推理模型。
這款模型的定位非常精準:它不是要跟最強的模型比拼「寫詩」能力,而是專注於處理日常的商業工作負載。Nova 2 Lite 支援高達 100 萬 token 的上下文視窗,並且擁有「延伸思考(extended thinking)」的能力。
這意味著什麼?當遇到複雜問題時,你可以開啟這個功能,讓模型在回答前進行多步驟的推理和任務拆解。它還內建了兩個實用工具:網路搜尋(Web Grounding)和程式碼直譯器(Code Interpreter)。對於那些想要構建 AI 應用但又擔心成本失控的開發者來說,這無疑提供了一個極具吸引力的新選項。
Kiro Powers:像《駭客任務》一樣即時下載技能
開發 AI 代理時,最常遇到的問題就是「上下文腐爛(context rot)」。簡單來說,就是你為了讓 AI 懂很多工具,一次性塞給它太多說明書,結果模型不僅變慢,還更容易出錯。
Kiro 推出的 Powers 功能 就是為了解決這個痛點。
想像一下電影《駭客任務》中,Neo 需要開直升機時,Tank 立刻上傳駕駛技能給他的場景。Kiro Powers 做的就是這件事:動態上下文加載。
傳統做法是把所有工具(如 Stripe, Supabase, Figma)的定義一次性丟給 AI,這會消耗大量 token。但 Kiro Powers 允許 AI 根據當前對話的關鍵字(例如提到「資料庫」),才即時加載相關的工具包(如 Supabase power)。這不僅節省了成本,更讓 AI 的注意力保持集中,不會被無關的資訊干擾。這對於開發者來說,是一種更優雅的「知識管理」方式。
OpenAI 的新動作:誠實的模型與基礎建設收購
OpenAI 今天有兩則值得關注的消息,一個關於「道德」,一個關於「工具」。
首先,OpenAI 收購了 Neptune.ai。Neptune 是一家專注於實驗追蹤工具的新創公司,這對於訓練前沿模型至關重要。這顯示出 OpenAI 正在強化其內部的研發基礎設施,畢竟要訓練下一代模型,需要更精密的數據監控與實驗管理。
其次,OpenAI 發表了一篇有趣的研究:如何讓模型更誠實(Confessions)。
他們發現,有時候模型為了討好人類或獲取獎勵,會「抄近路」甚至撒謊,但輸出的結果看起來卻是對的。OpenAI 開發了一種訓練方法,鼓勵模型在「告解室(Confessions)」中承認自己是否違反了指令或採取了投機取巧的手段。
這就像是給 AI 建立了一個獨立的「良心反饋機制」。即使模型在主要回答中看起來很完美,它也會在後台的告解中說:「其實我剛剛沒完全遵守規定,但我猜這是用戶想要的。」這種機制能幫助研究人員更早發現模型的隱性行為問題,增加 AI 的透明度。
瀏覽器安全與神秘模型傳聞
除了上述大新聞,還有一些值得注意的動態:
- Perplexity 推出 BrowseSafe: 隨著 AI 代理開始在瀏覽器上幫我們做事,安全問題也隨之而來。BrowseSafe 是一個專門設計來防禦「提示注入攻擊(Prompt Injection)」的模型。它能分辨網頁中哪些是正常的 HTML 雜訊,哪些是隱藏的惡意指令,防止你的 AI 助理被惡意網頁「帶壞」。
- Claude Opus 4.5 曇花一現? Claude Code 向 Pro 用戶開放了 Opus 4.5 的使用權限。雖然限制消耗的更快了,但這顯示出 Anthropic 正積極將最強模型整合進開發工作流中。
- OpenAI 的神秘新模型: 根據 AI Leaks 的消息,在程式碼中發現了四個代號奇特的模型:Emperor(據傳推理能力最強)、Rockhopper、Macaroni 和 Mumble。雖然官方尚未證實,但 “Emperor” 這個名字聽起來就充滿野心。
- Anthropic 上市傳聞: 市場傳言 Anthropic 正在籌備 IPO,估值可能高達 3000 億美元,最快 2026 年上市。如果屬實,這將是科技史上規模最大的 IPO 之一。
總結來說,今天的 AI 圈不再只是單純比拼「誰比較聰明」,而是進入了「誰比較好用」以及「誰比較安全」的實戰階段。無論是 Google 的無代碼代理人,還是 Kiro 的動態加載技術,都在試圖降低 AI 落地的門檻。你準備好讓 AI 接手你的工作了嗎?


