AI日報：OpenAI 資安端到端修補｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理｜ Moebius 輕量圖像修復

這是一份為開發者與科技愛好者準備的詳細解析。本文將帶領大家了解近期引人注目的技術進展。內容涵蓋 OpenAI 針對資訊安全與開源生態的最新支援，Google 提升開發體驗的實用 API 介面，以及多個極具潛力的視覺與多代理人編排系統。

OpenAI 的資安防禦與長期任務輔助

軟體安全一直是一項極具挑戰性的工作。雖然 AI 大幅加快了發現系統漏洞的速度，但現在防禦方面臨的新痛點是：被海量的漏洞報告淹沒，修補速度遠遠跟不上。針對「修補」這個瓶頸，OpenAI 正式推出 Daybreak 計畫。這是一套專門用來保護全球組織的強大工具組合。這項計畫的核心在於全面釋出具有強大修補能力的 GPT-5.5-Cyber 模型。該模型搭配 Codex Security 外掛程式，自動化執行尋找並修復現有系統漏洞的工作。這項功能顯著減輕了防禦方的壓力。

保護開源專案同樣刻不容緩。你知道嗎？許多極為重要的開源軟體其實只仰賴極少數的志工在維持。為提供實質協助，OpenAI 偕同 Trail of Bits 與 HackerOne 等知名機構啟動了 Patch the Planet 倡議。這項倡議提供專屬的安全專家審查資源，並結合先進模型的分析能力。這讓繁雜的漏洞修補過程變得更加順暢，大幅減輕開源維護者的日常負擔。

處理繁冗的程式碼專案時，單靠一次指令往往無法奏效。針對這個情況，官方釋出了一份名為 Codex-maxxing 的長期任務指南。這份白皮書詳細解說如何把 Codex 當作一個具備記憶功能的持續工作區。開發團隊可以藉此學習如何將遠大的目標拆解成可驗證的細小步驟。這份文件也指導開發者如何在交由系統自動執行與人工介入之間取得完美平衡。

提到 Codex 工具，先前有社群使用者反映該系統會在背景不斷寫入診斷日誌，這對固態硬碟造成了不小的耗損。這項疑慮現在已經得到解決。開發者 Vaibhav Srivastav 在社群平台發文確認，最新版本的 Codex 已經徹底修復這個日誌寫入異常的問題。強烈建議大家透過 npm 或 bash 安裝程式進行更新，確保硬體設備的健康狀態。

Google 生態系的開發與學習利器

開發者介面的友善程度，直接決定了工作效率。Google 宣布 Interactions API 正式上線。這個全新介面目前已經成為呼叫 Gemini 模型與代理程式的首選管道。想要深入了解的開發者可以直接查閱官方技術文件。

這個單一端點的設計極具巧思。它支援伺服器端狀態管理，意味著開發者不需要反覆傳送完整的對話歷史紀錄。該介面也同時整合了背景執行與多模態生成能力。許多人可能會好奇，這個新 API 究竟帶來什麼具體好處？簡單來說，它能大幅降低多輪對話的運算成本，讓建構複雜代理應用程式的流程變得無比直覺。

對於學生與需要整理大量資料的使用者來說，好用的學習工具總是令人振奮。NotebookLM 團隊釋出了完全可自訂的閃卡功能。現在使用者可以隨心所欲地編輯題目、調整答案，甚至加入全新的卡片。這項更新讓打造專屬學習組合變得非常輕鬆。準備好接受同學與學術對手的驚嘆了嗎？分享這些精心製作的閃卡，絕對會讓你收穫滿滿的讚譽。

突破框架：多代理人編排與進階視覺解析

單一模型的能力逐漸遇到瓶頸，協同合作成為新的突破口。Sakana AI 最新發表的 Fugu 多代理人編排系統完美展示了這個概念。Fugu 的特點在於它能動態協調一個包含多個強大模型的資源池。開發者可以透過單一的 API 端點直接呼叫並將此多代理人智慧整合進工作流程中，官方也提供了訂閱制（Subscription Plan）與按用量計費（Pay-as-you-go）等不同方案，以滿足日常或企業級的需求。

這套系統不依賴預先寫死的工作流程。Fugu 會自行學習如何挑選最合適的代理程式來處理不同任務，並透過巧妙的協作模式產出結果。這種設計讓多代理人系統用起來就像呼叫單一模型一樣簡單。

在視覺互動領域，京東 Joy Future Academy 帶來了令人眼睛一亮的作品。他們推出了名為 JoyAI-VL-Interaction 的即時影音互動模型。這個系統專注於提升機器理解連續影像與人類語言的流暢度。開發者可以前往 GitHub 頁面取得原始碼，進一步探索其即時互動的技術細節。

處理超長篇幅的文件一直是一項技術考驗。百度釋出的 Unlimited-OCR 模型專為支援單次處理高達 32K 權杖（tokens）的超長篇幅文本解析而生。對於有大量文檔處理需求的使用者，這是一個極具實用價值的工具。相關的技術實作與程式碼同樣可以在其 GitHub 儲存庫中找到。

最後，圖像修復技術迎來了一位輕量級的強力競爭者。華中科技大學與 VIVO AI Lab 共同研發了 Moebius 圖像修復框架。說實話，這個框架的參數規模僅有 0.22B，卻能展現出匹敵百億參數大模型的生成品質。有興趣的開發者可以造訪其 GitHub 頁面一探究竟。透過極致的結構壓縮與創新的知識蒸餾策略，Moebius 將推論速度大幅提升，讓消費級設備也能輕鬆執行高畫質的圖像修復作業。

問與答(Q&A)

問：OpenAI 的 Daybreak 計畫與 Patch the Planet 倡議，為了解決現代資安的什麼痛點？ 答：過去資安防禦最大的瓶頸是「發現」漏洞，但隨著 AI 模型（如 GPT-5.5-Cyber）大幅加快了找漏洞的速度，防禦方反而被海量的漏洞報告淹沒。現在的核心痛點已經轉移到「修補」漏洞上。因此，Daybreak 計畫與 Patch the Planet 倡議結合了先進模型與安全專家，致力於推動從發現到修補的「端到端」自動化修復流程，減輕組織與開源維護者的壓力。

問：Sakana AI 的 Fugu 多代理人系統特色是什麼？開發者可以下載它的開源碼來用嗎？ 答：Fugu 的最大特色是「動態協調」，它會自行分析任務需求，從包含 GPT-5.5、Claude-Opus-4.8 等強大模型的資源池中，挑選並組合最合適的代理程式來產出結果。該系統並非開源專案，而是提供單一的 API 端點，開發者可以直接呼叫並選擇「訂閱制」或「按用量計費」等付費方案，就像呼叫單一模型一樣簡單地運用多代理人系統。

問：如果專案建立在 Google 生態系上，新的 Interactions API 能帶來什麼具體好處？ 答：Interactions API 的一大亮點是支援「伺服器端狀態管理」。透過傳入 previous_interaction_id，開發者不需要在後續呼叫中反覆傳送完整的對話歷史紀錄。這不僅能提高快取命中率、大幅降低多輪對話的權杖運算成本，還內建了背景執行能力，讓建構複雜的代理應用程式變得更為直覺。

問：處理高畫質的圖像修復一定需要非常龐大的硬體資源嗎？ 答：不一定。由華中科技大學與 VIVO AI Lab 開發的 Moebius 圖像修復框架打破了這個限制。它透過特殊的架構設計（LλMI Block）與自適應多粒度蒸餾策略，參數規模僅有 0.22B（約 2.2 億），卻能達到匹敵 10B（百億）參數工業級模型（如 FLUX.1-Fill-Dev）的修復品質，且推論速度大幅提升超過 15 倍。

問：社群反映 Codex 工具會在背景不斷寫入診斷日誌，導致 SSD（固態硬碟）過度耗損，這個問題解決了嗎？ 答：是的，這個疑慮已經得到解決。開發者 Vaibhav Srivastav 已在社群平台確認，最新版本的 Codex 已經徹底修復了這個背景日誌異常寫入的問題。建議使用者透過 npm 或 bash 更新至最新安裝版本，以確保硬體壽命不受影響。

分享至:

Featured Partners

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

Recommended for You

A …

news

AI 日報 | AI 代理、實體機器狗、GPT-5.5 醫療對齊、開源 Boogu-Image 與矽谷人才流動

AI 日報 | AI 代理、實體機器狗、GPT-5.5 醫療對齊、開源 Boogu-Image 與矽谷人才流動每一天，科技圈的進展都在挑戰大家的想像力。你知道嗎？技術的推進從不等人。今天的重點超越了單純的算力堆疊，大家更關注如何讓這些工具自然地融入日常工作與真實生活。從具備自主能力的軟體代理，到能夠操控實體機器的模型，每一項突破都讓人目不暇給。事情是這樣的，讓我們仔細看看最近幾個引人注目的焦點。軟體與實體並進：AI 代理的全新舞台最近的開發工具圈相當熱鬧。OpenAI 為其 Codex 應用程式推出了 26.616 版本更新，其中最吸睛的莫過於 macOS 專屬的 Record & Replay 功能。這代表什麼？只要向 Codex 示範一次特定的工作流程，它就能將其打包成一個可重複使用的技能。老實說，能夠擺脫那些日復一日的重複點擊與輸入，絕對是許多人的福音。與此同時，視覺化協作也邁出了重要的一步。Anthropic 宣布 Claude Code 正式支援 Artifacts 功能。這項更新讓開發過程中的除錯日誌、架構圖或是發布清單，瞬間轉化為即時、可互動的網頁。團隊成員不需要再反覆透過文字確認進度，只要打開同一個頁面，就能看到隨著工作推進而自動更新的最新資訊。但這裡有一個常見的疑問：當 AI 代理需要幫忙部署網站或應用程式時，遇到那些專為人類設計的登入牆該怎麼辦？為了解決這個長久以來的痛點，Cloudflare 巧妙地推出了專屬 AI 代理的臨時帳號。過往代理程式在部署應用時，常常卡在人類專用的 OAuth 認證或多重驗證環節中。現在，AI 代理只需要在命令列中輸入 wrangler deploy --temporary 指令，就能自動取得一個有效期為 60 分鐘的臨時帳號，毫無阻礙地完成應用程式部署。人類隨後再透過專屬連結決定是否接管該帳號即可。這項巧妙的設計徹底移除了部署過程中的阻礙，代理程式終於可以毫無顧忌地大展身手。代理的潛力遠不僅止於軟體世界。Anthropic 最新的 Project Fetch 第二階段實驗展現了令人驚嘆的物理操作能力。研究人員在 Claude Code 中開啟了**「自適應思考（adaptive thinking）」並將「努力程度（effort）設定為最大」**，發現即使在完全沒有人類介入的情況下，Claude Opus 4.7 也能夠自主編寫程式並控制市售的機器狗。在完成指派的尋物任務時，Opus 4.7 的速度不僅比純人類團隊快了幾十倍，它產生的程式碼量（1,045 行）更幾乎只有純人類團隊（10,309 行）的十分之一。即便在處理非常精細的連續動作時仍有進步空間，這無疑宣告了物理代理 AI 早期發展的來臨。更加聰明且具備責任感的語言模型大家都希望 AI 既聰明又安全。OpenAI 發布的強化學習最新研究探討了如何訓練出廣泛且持續有益的模型。研究指出，僅僅在健康對話等單一領域對模型進行有益特徵的強化學習，這種良好行為居然可以廣泛轉移到其他陌生領域。此外，這項研究的一大亮點是展現了**「對抗性防禦（Alignment persistence）」**的能力：經過此訓練的模型，即使面臨惡意使用者的對抗性提示（adversarial prompting）試圖引導有害行為，或是遭遇惡意微調（harmful fine-tuning），模型依然能堅守底線拒絕給出有害建議。這項底層技術讓模型變得更誠實、透明，大幅降低了試圖欺騙的機率。

Jun 22, 2026 Read →

【 …

news

【AI 代理｜領域知識｜醫療創新】Claude Code 與 GitHub Copilot 改變開發協作，Midjourney 跨足醫療掃描，揭開 OpenAI 385 億美元虧損的商業現實

【AI 代理｜領域知識｜醫療創新】Claude Code 與 GitHub Copilot 改變開發協作，Midjourney 跨足醫療掃描，揭開 OpenAI 385 億美元虧損的商業現實你知道嗎？人工智慧的發展軌跡已經悄悄跨越了單純的對話框。現今的技術環境下，軟體不再只是被動等待指令的輔助工具。它們開始主動規劃，甚至直接執行複雜任務。這種轉變不僅改變了工程師的日常，更一路延伸到了科學實驗室與醫療檢測領域。讓我們仔細梳理近期科技圈的重大進展，一窺這些驚人突破的細節，以及藏在美好願景背後的殘酷商業現實。軟體工具大進化：AI 代理真的準備好接管工作了嗎？看看軟體開發領域正在發生的本質轉變。Anthropic 近期發布了一份關於 AI 代理寫程式的分析報告。這份報告揭露了一個非常有趣的現象。當人們使用 Claude Code 時，人類通常負責規劃大方向，而 AI 則接手處理繁瑣的執行細節。許多人可能會問：這代表工程師要失業了嗎？數據顯示的結論恰恰相反。決定專案成功與否的關鍵，往往取決於使用者的領域專業知識。不管你是否精通寫程式本身，只要你足夠了解要解決的業務邏輯，AI 就能幫你把構想轉化為實際的程式碼。這種工作模式的改變，也具體體現在開發工具的進化上。備受矚目的 GitHub Copilot 應用程式已經全面開放，正式支援 macOS、Windows 以及 Linux 作業系統。它不僅僅是一個編輯器外掛。這是一個專為代理驅動開發所打造的桌面大本營。開發者可以直接從 issue 啟動對話，利用畫布介面 (Canvases) 進行雙向協作，甚至在雲端排程自動化任務。這讓多個專案分支的推進變得無比順暢。事情是這樣的。當各種類型的 AI 代理變得越來越普及，它們極度需要一種能互相尋找資源的標準語言。Google 為此推出了 Agentic Resource Discovery (ARD) 規範。你可以把它想像成專屬 AI 代理的黃頁電話簿。透過這個完全開放的規範，不同的工具與代理系統可以藉由目錄 (Catalogs) 與註冊表 (Registries) 跨越組織界線，安全地驗證並連接彼此的能力。這徹底解決了長期以來各家系統各自為政的問題。同樣運用代理概念來減輕負擔的還有網路安全領域。Cloudflare 最新推出的 Cloudflare One stack 是一套專為代理工具打造的自動化部署方案。以往企業要轉移到零信任網路架構，總是令人望而生畏。現在，企業可以直接為 AI 代理裝備特定的技能模組。這些代理會自動盤點現有環境、翻譯不同廠商的艱澀設定，甚至直接產生直觀的網路架構圖。網路管理員只需審核最終的配置方案即可，大幅度減少了基礎設施設定的時間。打破常規：AI 如何跨足化學實驗室與實體水療中心？讓我們把視角從數位軟體轉向實體的科學領域。AI 的影響力已經開始改變藥物研發的遊戲規則。OpenAI 團隊對外展示了一個近乎自主的 AI 化學家。這套系統將強大的 GPT-5.4 模型與 Molecule.one 的高通量實驗室 Maria 完美結合。它能獨立提出假設、設計實驗網格並分析龐大數據。令人驚訝的是，這個 AI 化學家成功找到了一種名為 TEMPO 的溫和氧化劑，大幅提升了 Chan-Lam 偶聯反應的產率。這對於經常卡在合成瓶頸的藥物化學家來說，是一個極具實用價值的重大突破。

Jun 18, 2026 Read →

A …

news

AI日報｜ChatGPT 市佔下滑、Gemini 猛追、SpaceX 強勢進軍開發者市場

科技巨頭新動向：SpaceX 收購 Cursor、ChatGPT 市佔洗牌與 AI 實體化進程說實在的，當前人工智慧圈正經歷著劇烈的板塊推擠。每天醒來，新聞頭條上總會出現令人大跌眼鏡的商業決策或技術突破。從顛覆想像的企業併購，到日常穿戴裝置的全面升級，各種技術進展正以令人目不暇給的速度重塑整個生態圈。大家不妨靜下心來，仔細看看這幾天究竟發生了哪些足以撼動市場的大事件。火箭升空與程式碼的結合：SpaceX 收購 Cursor 你知道嗎？寫程式這項看似純粹軟體領域的工作，現在竟然跟發射火箭扯上關係了。SpaceX 已正式確認行使選擇權，以全股票交易的方式收購了熱門的程式碼編輯工具 Cursor。這個決策跌破了不少觀察家的眼鏡，但背後的野心卻相當清晰。他們的最終目標是打造出全球最實用的 AI 模型。 Cursor 團隊對此也表達了高度的期待與興奮。過去這幾個月以來，SpaceXAI 早就悄悄地與 Cursor 團隊展開密切合作，雙方共同訓練了一款全新模型。這款模型預計很快就會在 Cursor 以及 Grok Build 中與各位見面。把火箭工程的嚴謹與 AI 軟體開發的靈活結合在一起，絕對是科技史上一次極具象徵意義的聯姻。龍頭寶座動搖？ChatGPT 市佔率首度跌破五成就在 SpaceX 大張旗鼓擴充 AI 版圖的同時，市場的另一端卻出現了微妙的洗牌。根據最新數據顯示，ChatGPT 的市佔率有史以來首次滑落至 50% 以下。這絕非暗示 OpenAI 的技術退步，反倒凸顯了競爭對手正以驚人的速度迎頭趕上。截至五月底，ChatGPT 的市佔率已跌至 46.4%，而 Google 的 Gemini（迅速攀升至 27.7%）以及 Anthropic 的 Claude（達到 10.3%）正大口蠶食著這塊大餅。使用者變得越來越精明，大家不再盲目忠誠於單一工具。相反地，人們會根據不同的任務需求，靈活切換各種 AI 助理。Gemini 憑藉著與 Google 生態系的緊密結合贏得青睞，而 Claude 則以極高的邏輯處理穩定性留住了大量的專業用戶。這場 AI 助理的割喉戰，顯然才剛進入最精彩的階段。

Jun 17, 2026 Read →

AI日報：OpenAI 資安端到端修補 ｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理 ｜ Moebius 輕量圖像修復