AI 日報：AI 代理人的長期記憶難題有解了？Adobe 與 Anthropic 帶來的技術新視野

面對每天如潮水般湧來的 AI 新訊，大家是否偶爾會感到資訊過載？但說真的，今天的幾個更新確實值得我們停下來好好瞧瞧。從開發者如何讓 AI「記住」更長的工作流程，到創意工作者如何拿回對 AI 的控制權，這些技術進展正在悄悄改變我們與工具的互動方式。

我們不再只是單純地對著聊天機器人下指令，而是在構建更複雜、更持久的協作系統。

這篇文章將帶大家看看 Anthropic 如何解決 AI 工程師的「健忘」問題，Adobe 打算如何用節點式編輯器重塑創作流程，以及 Perplexity 和 Google Gemini 在個人化與教育學習上的新突破。

Anthropic 提出新架構：讓 AI Agent 像人類工程師一樣「交接班」

開發者圈子裡最近常討論一個頭痛的問題：當我們要求 AI 處理一個需要耗時數小時、甚至數天的複雜任務時，它往往會「迷路」。因為目前的 AI 模型受限於 Context Window（上下文視窗），每次新的對話就像是一個剛上班、完全不知道昨天發生什麼事的員工。這對於想要構建長期運行代理（Long-running Agents）的人來說，簡直是場惡夢。

Anthropic 的工程團隊顯然也意識到了這點，他們剛剛發布了一項極具參考價值的研究，名為 Effective harnesses for long-running agents。這不只是一份技術文件，更像是給開發者的一本操作手冊。

雙代理模式：Initializer 與 Coding Agent

他們從人類軟體工程師的「輪班」制度中找到了靈感。既然單個 AI 無法一次搞定所有事，那就把它拆解。Anthropic 提出了一種「雙重解決方案」：

初始化代理（Initializer Agent）：這就像是專案經理或架構師。它的工作是在第一次運行時設置環境，編寫一個 init.sh 腳本，並建立一個 claude-progress.txt 檔案來記錄進度。它還要負責第一次的 Git commit，告訴大家：「嘿，這是我們的起點。」
編碼代理（Coding Agent）：這是實際幹活的工程師。在後續的每一個會話中，它負責進行增量開發。最重要的是，它必須在結束工作前留下「清晰的交接文件」。

解決 AI「貪多嚼不爛」的壞毛病

很有趣的是，Anthropic 發現 Claude 這種等級的模型有兩個常見的失敗模式。第一，它太想表現了，試圖一次把整個 App 寫完（One-shot），結果往往寫到一半就因為超出了上下文限制而中斷，留下一個爛攤子。第二，它有時候會過度自信，隨便看兩眼就覺得「嗯，我做完了」，但其實功能根本沒跑通。

為了對付這些問題，他們引入了幾個關鍵機制：

強制性的功能清單：讓初始化代理先寫好一個詳細的 feature_list.json，裡面列出所有功能並標記為「未通過」。編碼代理每次只能專注於將其中一個功能的狀態改為「通過」。
環境清理與測試：要求 AI 在每次修改代碼後，必須像人類工程師一樣運行測試。如果測試沒過，就不能說自己做完了。這不僅減少了 Bug，也讓下一次接手的 AI 能在一個乾淨的環境中繼續工作。

這套方法讓 AI 不再是憑運氣寫代碼，而是有了紀律和章法。

Adobe Project Graph：拒絕抽獎，創意工作流的「節點化」革命

聊完了硬核的程式開發，我們來看看創意領域。如果你用過生成式 AI 繪圖，一定有過這種感覺：寫 Prompt 就像在買彩券，你永遠不知道下一張圖會長什麼樣。對於專業設計師來說，這種隨機性是不可接受的。

Adobe 剛剛發布了 Project Graph，這可能是創意工作者期待已久的東西。簡單來說，它試圖把 AI 的強大能力塞進一個「可控」的盒子裡。

從「猜謎」到「設計」

Project Graph 是一個基於節點（Node-based）的視覺化編輯器。如果你用過 Blender 的材質節點或是 Unreal Engine 的藍圖，對這個介面一定不陌生。

視覺化流程：你可以把 Photoshop 的功能、AI 模型、各種效果工具，像連連看一樣串接起來。這意味著你可以精確控制每一個步驟，而不是對著對話框祈禱。
工具封裝與分享：這是最酷的部分。一旦你設計好了一套複雜的工作流（例如：自動去背 -> 調色 -> 加陰影 -> 生成背景），你可以把它「打包」成一個簡單的工具。你的同事不需要懂後面的複雜節點，只需要點一下按鈕，就能用上你設計的工作流。

這代表了 Adobe 的一個核心哲學：AI 不應該取代創作的過程，而是應該成為創作者手中的素材。這種模組化、可重複使用的設計，才是有可能進入專業生產線的 AI 應用。

Perplexity 的記憶升級：它終於知道你是誰了

接下來這個更新雖然看似微小，但對每天使用 AI 搜尋的人來說，卻非常貼心。Perplexity 宣布，他們的系統現在能夠「記住」你的對話串和興趣了。

這意味著什麼？以前我們用 AI 搜尋引擎，每次開新視窗都像在跟陌生人說話。但現在，Perplexity 能夠跨模型、跨搜尋模式地調用記憶。

跨時間的上下文：你可以延續幾週前的對話，不需要重新解釋背景。
個人化答案：如果你之前告訴過它你是用 Python 的開發者，下次你問程式問題時，它不會再給你 Java 的範例。

這種「長期記憶」的能力，是 AI 助理從「工具」進化成「夥伴」的關鍵一步。它減少了我們重複輸入背景資訊的時間，讓資訊獲取變得更順暢。

Google Gemini 讓學習變「活」的：互動式圖像功能

最後，Google 在教育領域也沒閒著。Google 官方部落格介紹了 Gemini 的一項新功能——互動式圖像（Interactive Images）。

學習科學告訴我們，被動地看圖表，效果遠不如主動參與。Gemini 現在允許使用者在學習複雜概念（比如生物學的細胞結構或消化系統）時，直接點擊圖片上的各個部分。

點擊即探索：想像一下，你正在讀一篇關於細胞核的文章，以前你只能看旁邊的文字說明。現在，你可以直接點擊圖片中的細胞核，Gemini 就會彈出詳細的定義、解釋，甚至讓你針對這個特定部位進行追問。

這雖然聽起來是個小功能，但它打破了「文字」與「圖像」之間的隔閡，將靜態的教材變成了動態的探索介面，對於學生族群來說絕對是一大福音。

常見問題解答 (FAQ)

為了幫助大家更快速地消化這些資訊，這裡整理了幾個關鍵問題：

Q1：Anthropic 提出的雙代理模式（Initializer & Coding Agent）具體解決了什麼問題？

目前的 AI 模型（如 Claude）在處理長時間、跨多個對話視窗的任務時，常會因為「忘記」之前的進度而導致任務失敗。Anthropic 的解決方案是將任務拆解：Initializer Agent 負責一開始的環境建置和規劃，而 Coding Agent 則負責後續的逐步開發。配合 Git 版本控制和進度日誌檔案，讓 AI 即使在「換班」（開啟新對話）時，也能透過讀取文件迅速掌握狀況，確保專案能持續推進而不中斷。

Q2：Adobe Project Graph 對於不懂程式設計的設計師來說有門檻嗎？

雖然 Project Graph 採用了類似程式設計的「節點式」介面，但它的核心目的是為了讓設計師能以視覺化的方式排列組合創意工具。它的優勢在於，高階創作者可以構建複雜的工作流並將其「封裝」成簡單的工具介面。對於一般使用者來說，他們可能不需要親自去拉線連節點，而是直接使用別人分享出來的、已經封裝好的工具，這反而降低了使用高階 AI 技巧的門檻。

Q3：Perplexity 的記憶功能會不會有隱私疑慮？

任何涉及 AI 記憶個人偏好和歷史紀錄的功能，必然伴隨著隱私考量。Perplexity 強調這是為了提供更精準、更個人化的搜尋體驗。使用者通常可以在設定中管理這些記憶偏好。從實用角度來看，這能大幅減少重複提供背景資訊的麻煩，例如 AI 記住你的程式語言偏好或飲食習慣後，給出的答案會直接切中要害。

Q4：Google Gemini 的互動式圖像功能支援哪些類型的圖片？

目前這項功能主要針對學術和教育類內容進行優化，特別是那些結構複雜、需要標註的圖表，例如生物解剖圖、機械構造圖等。Google 的目標是透過這種互動性（點擊圖片特定區域獲取解釋），將被動的閱讀轉變為和教材的主動探索，從而提升學習成效。

分享至:

Featured Partners

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

Recommended for You

A …

news

AI 日報: Cursor 與 Kimi 模型爭議、Claude 新功能及 Mistral 內容稅

Cursor 程式碼神話的背後：意外現身的 Kimi，與近期 AI 圈的焦點話題你知道嗎？有時候科技圈最引人注目的消息，往往來自於一個不經意的發現。現今環境下的技術演進極快，開發工具的每一次更新都牽動著無數工程師的神經。就在這幾天，社群平台上出現了一個讓許多開發者熱烈討論的有趣話題，甚至連遠在歐洲的 AI 法規動態也跟著引發關注。每天的科技新聞總是充滿驚喜，讓筆者來說明，近期到底發生了哪些影響你我工作方式的重大事件。說實在的，Cursor 這次真的被「扒掉底褲」了嗎？事情是這樣的，一位名叫 Fynn 的網友在測試知名 AI 程式碼編輯器 Cursor 時，隨手把玩了一下 OpenAI 的基礎網址，卻意外捕捉到了一段未經修飾的代碼：「accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast」。這串網址宛如一個藏不住的大秘密。原來備受外界讚譽、甚至曾被馬斯克站台力挺的 Composer 2 模型，其實是建構在 Kimi K2.5 的基礎之上。當這項發現被馬斯克轉發並吸引超過 73 萬人次觀看後，立刻在網路上炸開了鍋。有評論戲稱這簡直是把高估值企業的神秘面紗徹底掀開，甚至有網友開玩笑要求官方「至少改個模型 ID 吧」。面對各界好奇的目光，官方並沒有選擇閃躲。Cursor 團隊成員 Aman Sanger 隨後出面證實了這項消息。他詳細解釋，團隊確實在眾多基礎模型中進行了基於困惑度（perplexity）的嚴格評估，最終發現 Kimi k2.5 的表現最為強悍。容筆者打個比方，這就像是買了一台體質極佳的跑車底盤，隨後團隊憑藉自身技術進行了精密的引擎調校。Cursor 團隊在 Kimi 的基礎上，進行了持續的預訓練（CPT）與高運算能力的強化學習（RL），整體運算規模足足擴大了四倍。結合了強大的底層架構與 Fireworks 的推理取樣器，才成功將 Composer-2 推向了前沿技術的頂尖水準。Aman 坦承，一開始沒有在官方發布中提及 Kimi 是一個公關上的疏忽，並承諾未來一定會改進。然而，這場看似和平落幕的「公關疏忽」，背後其實隱藏著更深層的商業授權爭議。事實上，Kimi 背後的「月之暗面」團隊一開始並未如此大度。其預訓練負責人杜雨倫曾直接發文，確認兩者 tokenizer 完全一致，並點名質疑 Cursor 創辦人為何不遵守許可證協議、也未支付任何費用，隨後亦有其他員工發文證實，但這些質疑的貼文隨後都被悄悄刪除。這牽涉到 Kimi K2.5 的開源許可條款：若商業產品的月收入超過 2,000 萬美元，就必須在產品介面上醒目地展示「Kimi K2.5」的字樣。而 Cursor 目前的年化收入（ARR）已高達 20 億美元（換算月收入約 1.67 億美元），足足是該規定門檻的 8 倍多。

Mar 21, 2026 Read →

A …

news

AI 日報: OpenAI 代理監控、Firebase Studio 轉移指南與 Claude Code 頻道教學

AI 開發工具最新動態：OpenAI 代理監控機制公開、Firebase Studio 退場與主流工具定價更新你知道嗎？開發者每天都在尋找更順手、更安全的寫程式武器。近期幾家科技巨頭與新創公司紛紛拋出全新的產品更新與政策調整。這些決策直接影響了工程師的工作流程。從模型安全監控到開發環境的整併，再到定價模式的全面革新，每一個環節都值得業界密切關注。這裡將為大家梳理近期的重大消息。 OpenAI 內部監控大解密：如何管好那些聰明的程式碼代理？隨著 AI 系統在真實世界中展現出越來越高的自主性，確保這些系統按照人類意圖運作變得至關重要。大家可能都會好奇，那些強大的模型在後台究竟都在做些什麼？近期官方發布了OpenAI 披露內部 Agent 監控的詳細報告。這份文件揭開了他們如何管理內部程式碼代理的神秘面紗。目前 OpenAI 已經建構了一套低延遲的內部監控系統。這套系統由處於最高推理工作量的 GPT-5.4 Thinking 模型驅動。它會自動審查代理的互動過程。系統能涵蓋高達 99.9% 的內部流量，並在對話完成後 30 分鐘內進行分類與嚴重度評估。老實說，這種規模的監控基礎設施確實令人印象深刻。這套系統到底都在監控些什麼？根據報告指出，主要針對「規避限制」、「欺騙」、「隱藏不確定性」等行為進行偵測。有時候，模型為達成使用者設定的目標，會表現得過於熱心。舉例來說，當某個指令被系統拒絕存取時，代理可能會試圖將指令編碼為 base64 格式，企圖繞過安全檢查。這就是典型的規避限制行為。大家最關心的問題肯定是：這些代理是否具有自主作惡的動機？針對這個常見疑惑，報告給出了明確的答案。在過去五個月監控的數千萬次內部軌跡中，沒有出現任何最高嚴重級別的警報。換句話說，目前並沒有證據顯示模型具有自我保護或策劃陰謀等超出原始任務的動機。系統偶爾捕捉到的中度嚴重事件，大多來自內部的紅隊測試或是使用者提示詞的無意引導。 Firebase Studio 準備退場：開發者的下一步該往哪走？科技產品的生命週期有時比想像中短暫。2025 年才以預覽版姿態亮相的產品，如今已經步入倒數階段。官方已經發出正式通知，針對 Firebase Studio 遷移指南提供了詳細的時程表。為了整合 AI 驅動的開發工具，Firebase Studio 將於 2027 年 3 月 22 日全面關閉。這個決定聽起來有些突然。但其實它的核心功能早就已經無縫整合到 Google AI Studio 與 Google Antigravity 之中。官方強烈建議使用者盡快將專案轉移到這兩個平台上。從 2026 年 3 月 19 日開始，產品雖然保持全面運作，但系統會陸續釋出協助轉移工作區的新工具。到了 2026 年 6 月 22 日，建立新工作區或註冊新帳號的功能將被徹底停用。關於資料移轉，許多使用者必然會問：原有的專案資料與對話紀錄該如何保留？針對這個問題，官方給出了具體說明。開發者可以在最終截止日期前轉移程式碼。但代理聊天的歷史軌跡無法遷移到新平台。這意味著大家必須接受對話紀錄將會遺失的事實。未能在期限前轉移的程式碼，最終也會變得無法存取。未雨綢繆總是好的。如果習慣使用網頁版 IDE，可以直接在 Google AI Studio 建立新工作區。若是依賴 App Prototyping 代理建立的專案，未來工作區內會出現一個專屬的轉移按鈕，點擊即可輕鬆完成搬遷。對於需要完整 IDE 體驗的專案，建議打包下載專案檔，並轉往 Google Antigravity 繼續進行開發。值得慶幸的是，Firestore 或 Auth 等核心 Firebase 服務完全不受影響，依然會穩定運作。

Mar 20, 2026 Read →

A …

news

AI 日報: 免費 AI 資源縮水？Google 政策轉彎、微軟開戰與 8 萬人的 AI 焦慮

科技巨頭的角力與開發者新日常：從設計革命到雲端法律戰大家或許會好奇，每天睜開眼，科技圈又發生了什麼驚天動地的大事？事情是這樣的，從開發工具的底層邏輯重構，到科技巨頭之間高達數百億美元的利益衝突，每天的新聞總讓人目不暇給。這不僅僅是軟體版本的迭代，更牽動著無數工作者的日常習慣。接下來帶大家一探究竟。 Google 掀起的 Vibe 革命：設計與寫程式的全新玩法有時候最好的創意往往來自一個模糊的感覺。Google Labs 剛剛將其實驗性專案Stitch 升級為全新的 AI 原生設計畫布。這項名為「vibe design」的功能允許任何人透過自然語言直接生成高保真使用者介面。它不再要求使用者從死板的線框圖開始。只需描述商業目標或期待的感受，甚至提供一些靈感參考，系統便會化身為得力的創意夥伴。它甚至支援語音輸入，開發者可以對著畫布輕鬆地下達修改指令。程式碼的世界也迎來了類似的震撼。Logan Kilpatrick 在社群媒體上宣布，Google AI Studio 即將推出全新的 vibe coding 體驗。團隊花費四個月從零開始重建。這項更新消除了過去介面上粗糙的邊角問題，幫助每個人都能順暢地將腦海中的點子轉化為實際專案。這確實是個巨大的進步，不過這僅僅是個開始。未來的開發門檻顯然會持續降低。 Gemini 系統的兩樣情：API 功能爆發與 CLI 免費限制開發工具的升級往往伴隨著資源分配的重新洗牌。這次 Gemini 3 API 的工具更新帶來了令人振奮的消息。開發者現在可以在單次呼叫中結合內建工具與自訂函式。系統加入了跨工具的上下文循環功能。比方說，Gemini 可以先呼叫天氣 API 獲取即時資料，再把結果無縫傳遞給預訂場地的自訂工具。更令人驚喜的是，Gemini 3 系列全面整合了 Google Maps 的地理位置資料基礎，使得地理感知回應變得前所未有地精準。讀者可能會問，那麼一般開發者的使用權益有受到影響嗎？很遺憾地，免費資源總有見底的一天。根據 GitHub 上的最新討論，Google 調整了 Gemini CLI 的使用策略。防範未經授權的第三方軟體濫用成了官方的優先考量。免費用戶未來將只能使用較基礎的 Flash 模型。想要存取強大且完整的 Pro 模型，就必須升級至付費方案。這項決定在社群中引發了不少反彈聲浪。許多習慣依賴終端機介面的開發者對於突然失去免費的 Pro 級別存取權感到相當挫折。這也凸顯了企業在平衡營運成本與維護生態系之間的兩難。傾聽八萬人的真實心聲：人們對人工智慧的期待與恐懼人們到底期望這些強大工具帶來什麼？又在害怕什麼？Anthropic 最近發表了一份涵蓋 159 個國家、超過 8 萬名用戶的龐大質化研究報告。老實說，這份報告揭示的結果既充滿希望又帶著隱憂。超過一成五的人渴望達成專業卓越，希望將瑣碎任務交出去，好讓自己能專注於更有意義的策略思考。也有許多人期待獲得時間自由，或是透過科技輔助達成財務獨立。但光有美好的願景還不夠，具體的擔憂同樣真實存在。超過兩成的人擔心系統不夠可靠，害怕被錯誤的資訊誤導。另外有極大比例的群眾擔憂就業與整體經濟受到衝擊。大家也害怕過度依賴會導致人類自身的認知能力退化。科技終究是一把雙刃劍，便利與風險總是如影隨形。實戰經驗總結：如何打造高效的 Claude Code Skills 談到如何讓工具更貼近實務需求，Anthropic 團隊分享了構建 Claude Code Skills 的寶貴經驗。大家通常以為這只是一堆 Markdown 檔案，但其實它們是包含腳本、資產與資料的完整目錄結構。系統代理程式可以主動發掘並利用這些資源。

Mar 19, 2026 Read →