AI 日報 | AI 代理、實體機器狗、GPT-5.5 醫療對齊、開源 Boogu-Image 與矽谷人才流動

每一天，科技圈的進展都在挑戰大家的想像力。你知道嗎？技術的推進從不等人。今天的重點超越了單純的算力堆疊，大家更關注如何讓這些工具自然地融入日常工作與真實生活。從具備自主能力的軟體代理，到能夠操控實體機器的模型，每一項突破都讓人目不暇給。事情是這樣的，讓我們仔細看看最近幾個引人注目的焦點。

軟體與實體並進：AI 代理的全新舞台

最近的開發工具圈相當熱鬧。OpenAI 為其 Codex 應用程式推出了 26.616 版本更新，其中最吸睛的莫過於 macOS 專屬的 Record & Replay 功能。這代表什麼？只要向 Codex 示範一次特定的工作流程，它就能將其打包成一個可重複使用的技能。老實說，能夠擺脫那些日復一日的重複點擊與輸入，絕對是許多人的福音。

與此同時，視覺化協作也邁出了重要的一步。Anthropic 宣布 Claude Code 正式支援 Artifacts 功能。這項更新讓開發過程中的除錯日誌、架構圖或是發布清單，瞬間轉化為即時、可互動的網頁。團隊成員不需要再反覆透過文字確認進度，只要打開同一個頁面，就能看到隨著工作推進而自動更新的最新資訊。

但這裡有一個常見的疑問：當 AI 代理需要幫忙部署網站或應用程式時，遇到那些專為人類設計的登入牆該怎麼辦？

為了解決這個長久以來的痛點，Cloudflare 巧妙地推出了專屬 AI 代理的臨時帳號。過往代理程式在部署應用時，常常卡在人類專用的 OAuth 認證或多重驗證環節中。現在，AI 代理只需要在命令列中輸入 wrangler deploy --temporary 指令，就能自動取得一個有效期為 60 分鐘的臨時帳號，毫無阻礙地完成應用程式部署。人類隨後再透過專屬連結決定是否接管該帳號即可。這項巧妙的設計徹底移除了部署過程中的阻礙，代理程式終於可以毫無顧忌地大展身手。

代理的潛力遠不僅止於軟體世界。Anthropic 最新的 Project Fetch 第二階段實驗展現了令人驚嘆的物理操作能力。研究人員在 Claude Code 中開啟了**「自適應思考（adaptive thinking）」並將「努力程度（effort）設定為最大」**，發現即使在完全沒有人類介入的情況下，Claude Opus 4.7 也能夠自主編寫程式並控制市售的機器狗。在完成指派的尋物任務時，Opus 4.7 的速度不僅比純人類團隊快了幾十倍，它產生的程式碼量（1,045 行）更幾乎只有純人類團隊（10,309 行）的十分之一。即便在處理非常精細的連續動作時仍有進步空間，這無疑宣告了物理代理 AI 早期發展的來臨。

更加聰明且具備責任感的語言模型

大家都希望 AI 既聰明又安全。OpenAI 發布的強化學習最新研究探討了如何訓練出廣泛且持續有益的模型。研究指出，僅僅在健康對話等單一領域對模型進行有益特徵的強化學習，這種良好行為居然可以廣泛轉移到其他陌生領域。此外，這項研究的一大亮點是展現了**「對抗性防禦（Alignment persistence）」**的能力：經過此訓練的模型，即使面臨惡意使用者的對抗性提示（adversarial prompting）試圖引導有害行為，或是遭遇惡意微調（harmful fine-tuning），模型依然能堅守底線拒絕給出有害建議。這項底層技術讓模型變得更誠實、透明，大幅降低了試圖欺騙的機率。

這項底層技術的進展，直接反映在實際產品上。OpenAI 致力於提升 ChatGPT 的健康醫療智慧。經過大量醫師的共同評估與打磨，目前的 GPT-5.5 Instant 模型在處理真實醫療情境時，表現得更加謹慎與準確。事實性錯誤的比例在短短兩個月內下降了高達 71%。它學會了在不確定時坦誠以告，並適時鼓勵使用者尋求專業的醫療照護。

在多模態理解方面，同樣有令人眼睛一亮的應用。DeepSeek 官方員工證實其識圖模式已經在網頁端與應用程式上線。使用者可以嘗試在思考模式下輸入 [Think with Grounding] 或 [Think with Pointing] 等特定的提示詞。這會引導模型採用邊界框或標記點的方式來解析圖像。用標記點來代表連續的軌跡，讓模型的推理過程看起來更貼近人類的直覺。就算要完美處理真實世界的連續軌跡依舊是整個業界的挑戰，這項新功能絕對值得親自去探索一番。

以小搏大的開源驚喜：Boogu-Image

說到生成式 AI，開源社群永遠充滿活力。近期備受矚目的 Boogu-Image-0.1 專案提供了一個極佳的範例。這是一個採用 Apache-2.0 授權的開源統一圖像生成與編輯模型家族，包含了 Base、Turbo 以及 Edit 等多種變體。它的驚人之處在於資源運用的極致效率。研究團隊僅使用了比其他開源模型少一個數量級的訓練資料，就達到了媲美頂級閉源系統的成效。無論是處理高品質的文生圖、快速生成，還是複雜的中英文雙語文字渲染，Boogu-Image 都展現了優異的穩定性。想要自行測試的開發者，也可以直接在 Hugging Face 平台上獲取 Boogu 的模型權重。這項專案無疑為整個多模態開源生態系注入了一劑強心針。

頂級專家的下一步：科技巨頭人才大風吹

科技的推進終究依賴於背後那一群充滿熱情的人。近期，矽谷的人才版圖發生了引人注目的流動。引領 AlphaFold 團隊取得歷史性突破的 John Jumper 宣布離開待了近九年的 Google DeepMind，並準備在短暫休息後加入 Anthropic。他對於前東家給予的機會充滿感激，但也十分期待能在新環境中展開下一段旅程。

無獨有偶，另一位 AI 領域的重量級學者 Noam Shazeer 也對外公開表示，他將告別 Google 並轉戰 OpenAI。他強調離開是一個艱難的決定，同時也非常期待與 OpenAI 的卓越團隊並肩作戰。這種頂尖人才的跨界流動，往往預示著各家公司接下來的技術戰略走向。未來這些大腦會在新的實驗室裡激盪出什麼樣的火花，絕對值得大家持續關注。

問與答(Q&A)

Q1：當 AI 代理（AI Agent）需要自動幫忙部署應用程式時，遇到人類專用的「登入牆」或認證該怎麼辦？ A： Cloudflare 針對這個痛點推出了專屬 AI 代理的「臨時帳號」機制。現在，AI 代理只需在命令列輸入 wrangler deploy --temporary 指令，就能自動取得一個 60 分鐘有效的臨時帳號來完成部署，完全不需要人類介入處理複雜的驗證步驟。

Q2：AI 目前在控制實體機器（物理代理）的發展走到哪了？ A：進展非常驚人！根據 Anthropic 最新的 Project Fetch 第二階段實驗，在沒有人類介入的情況下，Claude Opus 4.7 已經能夠自主編寫程式來控制市售機器狗執行任務。而且它的速度比純人類團隊快了幾十倍，產生的程式碼量（1,045 行）更只有人類團隊（10,309 行）的十分之一。

Q3：隨著模型越來越聰明，開發商如何確保它們不會給出危險或騙人的建議（例如醫療領域）？ A： OpenAI 透過最新的「強化學習（RL）」技術來培養模型廣泛且持續的有益特徵。例如在 GPT-5.5 Instant 的醫療健康應用上，事實性錯誤不僅大幅下降了 71%，這項訓練還賦予了模型「對抗性防禦（Alignment persistence）」的能力。這代表即使面臨惡意使用者的誘導提示，模型也能堅守底線，拒絕給出有害建議。

Q4：近期在開源社群中，有什麼值得關注的圖像生成模型嗎？ A： Boogu-Image-0.1 是一個極佳的範例。它採用 Apache-2.0 授權，最大亮點是「資源運用的極致效率」。研究團隊僅使用比其他開源模型少一個數量級的訓練資料，就達成了媲美頂級閉源系統的效能，不僅在高品質文生圖與編輯上表現優異，在處理複雜的中英文雙語文字渲染時也非常穩定。

Q5：近期矽谷的 AI 頂尖人才板塊發生了什麼重大變動？ A：近期有兩位重量級專家離開了 Google。一位是帶領 AlphaFold 團隊取得重大突破的 John Jumper，他宣布將加入 Anthropic；另一位是 AI 領域的頂尖學者 Noam Shazeer，他也公開表示將轉戰 OpenAI。這些核心大腦的流動，是觀察科技巨頭未來技術戰略的重要指標。

分享至:

Featured Partners

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

scribis.app

Scribis: 字幕編輯、語音轉錄文字、即時顯示轉錄文字。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

Recommended for You

A …

news

AI日報：OpenAI 資安端到端修補｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理｜ Moebius 輕量圖像修復

AI日報：OpenAI 資安端到端修補｜ Fugu 多代理人 API ｜ Google Interactions 狀態管理｜ Moebius 輕量圖像修復這是一份為開發者與科技愛好者準備的詳細解析。本文將帶領大家了解近期引人注目的技術進展。內容涵蓋 OpenAI 針對資訊安全與開源生態的最新支援，Google 提升開發體驗的實用 API 介面，以及多個極具潛力的視覺與多代理人編排系統。 OpenAI 的資安防禦與長期任務輔助軟體安全一直是一項極具挑戰性的工作。雖然 AI 大幅加快了發現系統漏洞的速度，但現在防禦方面臨的新痛點是：被海量的漏洞報告淹沒，修補速度遠遠跟不上。針對「修補」這個瓶頸，OpenAI 正式推出 Daybreak 計畫。這是一套專門用來保護全球組織的強大工具組合。這項計畫的核心在於全面釋出具有強大修補能力的 GPT-5.5-Cyber 模型。該模型搭配 Codex Security 外掛程式，自動化執行尋找並修復現有系統漏洞的工作。這項功能顯著減輕了防禦方的壓力。保護開源專案同樣刻不容緩。你知道嗎？許多極為重要的開源軟體其實只仰賴極少數的志工在維持。為提供實質協助，OpenAI 偕同 Trail of Bits 與 HackerOne 等知名機構啟動了 Patch the Planet 倡議。這項倡議提供專屬的安全專家審查資源，並結合先進模型的分析能力。這讓繁雜的漏洞修補過程變得更加順暢，大幅減輕開源維護者的日常負擔。處理繁冗的程式碼專案時，單靠一次指令往往無法奏效。針對這個情況，官方釋出了一份名為 Codex-maxxing 的長期任務指南。這份白皮書詳細解說如何把 Codex 當作一個具備記憶功能的持續工作區。開發團隊可以藉此學習如何將遠大的目標拆解成可驗證的細小步驟。這份文件也指導開發者如何在交由系統自動執行與人工介入之間取得完美平衡。提到 Codex 工具，先前有社群使用者反映該系統會在背景不斷寫入診斷日誌，這對固態硬碟造成了不小的耗損。這項疑慮現在已經得到解決。開發者 Vaibhav Srivastav 在社群平台發文確認，最新版本的 Codex 已經徹底修復這個日誌寫入異常的問題。強烈建議大家透過 npm 或 bash 安裝程式進行更新，確保硬體設備的健康狀態。 Google 生態系的開發與學習利器開發者介面的友善程度，直接決定了工作效率。Google 宣布 Interactions API 正式上線。這個全新介面目前已經成為呼叫 Gemini 模型與代理程式的首選管道。想要深入了解的開發者可以直接查閱官方技術文件。這個單一端點的設計極具巧思。它支援伺服器端狀態管理，意味著開發者不需要反覆傳送完整的對話歷史紀錄。該介面也同時整合了背景執行與多模態生成能力。許多人可能會好奇，這個新 API 究竟帶來什麼具體好處？簡單來說，它能大幅降低多輪對話的運算成本，讓建構複雜代理應用程式的流程變得無比直覺。

Jun 23, 2026 Read →

【 …

news

【AI 代理｜領域知識｜醫療創新】Claude Code 與 GitHub Copilot 改變開發協作，Midjourney 跨足醫療掃描，揭開 OpenAI 385 億美元虧損的商業現實

【AI 代理｜領域知識｜醫療創新】Claude Code 與 GitHub Copilot 改變開發協作，Midjourney 跨足醫療掃描，揭開 OpenAI 385 億美元虧損的商業現實你知道嗎？人工智慧的發展軌跡已經悄悄跨越了單純的對話框。現今的技術環境下，軟體不再只是被動等待指令的輔助工具。它們開始主動規劃，甚至直接執行複雜任務。這種轉變不僅改變了工程師的日常，更一路延伸到了科學實驗室與醫療檢測領域。讓我們仔細梳理近期科技圈的重大進展，一窺這些驚人突破的細節，以及藏在美好願景背後的殘酷商業現實。軟體工具大進化：AI 代理真的準備好接管工作了嗎？看看軟體開發領域正在發生的本質轉變。Anthropic 近期發布了一份關於 AI 代理寫程式的分析報告。這份報告揭露了一個非常有趣的現象。當人們使用 Claude Code 時，人類通常負責規劃大方向，而 AI 則接手處理繁瑣的執行細節。許多人可能會問：這代表工程師要失業了嗎？數據顯示的結論恰恰相反。決定專案成功與否的關鍵，往往取決於使用者的領域專業知識。不管你是否精通寫程式本身，只要你足夠了解要解決的業務邏輯，AI 就能幫你把構想轉化為實際的程式碼。這種工作模式的改變，也具體體現在開發工具的進化上。備受矚目的 GitHub Copilot 應用程式已經全面開放，正式支援 macOS、Windows 以及 Linux 作業系統。它不僅僅是一個編輯器外掛。這是一個專為代理驅動開發所打造的桌面大本營。開發者可以直接從 issue 啟動對話，利用畫布介面 (Canvases) 進行雙向協作，甚至在雲端排程自動化任務。這讓多個專案分支的推進變得無比順暢。事情是這樣的。當各種類型的 AI 代理變得越來越普及，它們極度需要一種能互相尋找資源的標準語言。Google 為此推出了 Agentic Resource Discovery (ARD) 規範。你可以把它想像成專屬 AI 代理的黃頁電話簿。透過這個完全開放的規範，不同的工具與代理系統可以藉由目錄 (Catalogs) 與註冊表 (Registries) 跨越組織界線，安全地驗證並連接彼此的能力。這徹底解決了長期以來各家系統各自為政的問題。同樣運用代理概念來減輕負擔的還有網路安全領域。Cloudflare 最新推出的 Cloudflare One stack 是一套專為代理工具打造的自動化部署方案。以往企業要轉移到零信任網路架構，總是令人望而生畏。現在，企業可以直接為 AI 代理裝備特定的技能模組。這些代理會自動盤點現有環境、翻譯不同廠商的艱澀設定，甚至直接產生直觀的網路架構圖。網路管理員只需審核最終的配置方案即可，大幅度減少了基礎設施設定的時間。打破常規：AI 如何跨足化學實驗室與實體水療中心？讓我們把視角從數位軟體轉向實體的科學領域。AI 的影響力已經開始改變藥物研發的遊戲規則。OpenAI 團隊對外展示了一個近乎自主的 AI 化學家。這套系統將強大的 GPT-5.4 模型與 Molecule.one 的高通量實驗室 Maria 完美結合。它能獨立提出假設、設計實驗網格並分析龐大數據。令人驚訝的是，這個 AI 化學家成功找到了一種名為 TEMPO 的溫和氧化劑，大幅提升了 Chan-Lam 偶聯反應的產率。這對於經常卡在合成瓶頸的藥物化學家來說，是一個極具實用價值的重大突破。

Jun 18, 2026 Read →

A …

news

AI日報｜ChatGPT 市佔下滑、Gemini 猛追、SpaceX 強勢進軍開發者市場

科技巨頭新動向：SpaceX 收購 Cursor、ChatGPT 市佔洗牌與 AI 實體化進程說實在的，當前人工智慧圈正經歷著劇烈的板塊推擠。每天醒來，新聞頭條上總會出現令人大跌眼鏡的商業決策或技術突破。從顛覆想像的企業併購，到日常穿戴裝置的全面升級，各種技術進展正以令人目不暇給的速度重塑整個生態圈。大家不妨靜下心來，仔細看看這幾天究竟發生了哪些足以撼動市場的大事件。火箭升空與程式碼的結合：SpaceX 收購 Cursor 你知道嗎？寫程式這項看似純粹軟體領域的工作，現在竟然跟發射火箭扯上關係了。SpaceX 已正式確認行使選擇權，以全股票交易的方式收購了熱門的程式碼編輯工具 Cursor。這個決策跌破了不少觀察家的眼鏡，但背後的野心卻相當清晰。他們的最終目標是打造出全球最實用的 AI 模型。 Cursor 團隊對此也表達了高度的期待與興奮。過去這幾個月以來，SpaceXAI 早就悄悄地與 Cursor 團隊展開密切合作，雙方共同訓練了一款全新模型。這款模型預計很快就會在 Cursor 以及 Grok Build 中與各位見面。把火箭工程的嚴謹與 AI 軟體開發的靈活結合在一起，絕對是科技史上一次極具象徵意義的聯姻。龍頭寶座動搖？ChatGPT 市佔率首度跌破五成就在 SpaceX 大張旗鼓擴充 AI 版圖的同時，市場的另一端卻出現了微妙的洗牌。根據最新數據顯示，ChatGPT 的市佔率有史以來首次滑落至 50% 以下。這絕非暗示 OpenAI 的技術退步，反倒凸顯了競爭對手正以驚人的速度迎頭趕上。截至五月底，ChatGPT 的市佔率已跌至 46.4%，而 Google 的 Gemini（迅速攀升至 27.7%）以及 Anthropic 的 Claude（達到 10.3%）正大口蠶食著這塊大餅。使用者變得越來越精明，大家不再盲目忠誠於單一工具。相反地，人們會根據不同的任務需求，靈活切換各種 AI 助理。Gemini 憑藉著與 Google 生態系的緊密結合贏得青睞，而 Claude 則以極高的邏輯處理穩定性留住了大量的專業用戶。這場 AI 助理的割喉戰，顯然才剛進入最精彩的階段。

Jun 17, 2026 Read →

AI 日報 | AI 代理、實體機器狗、GPT-5.5 醫療對齊、開源 Boogu-Image 與矽谷人才流動