news

AI 日報: Claude Opus 4.7的震撼與爭議,以及OpenAI Codex的全面進化

April 17, 2026
Updated Apr 17
2 min read

Claude Opus 4.7的震撼與爭議,以及OpenAI Codex的全面進化

現今,人工智慧的發展腳步令人目不暇給。我們每天都在適應新的工具與技術。老實說,有時候要跟上這些排山倒海的資訊真的讓人喘不過氣。不過,這就是關鍵所在,掌握最新動態能幫助我們更聰明地工作。四月份帶來了幾項震撼業界的消息。從模型升級到引發社群熱議的爭議,再到各大巨頭針對特定領域的精準佈局。接下來,讓我們仔細檢視這些改變將如何影響你我的日常工作。

Claude Opus 4.7 閃亮登場:是能力大躍進,還是變相漲價?

Anthropic 本月宣布 Claude Opus 4.7 正式推出,主打在軟體工程方面的卓越表現。它不僅能更嚴謹地處理長時間運行的任務,還擁有比前代高出三倍的視覺解析度。這聽起來很完美,對吧?其實細節藏在魔鬼裡。

許多開發者可能會疑惑:Opus 4.7 到底好不好用?社群論壇 Reddit 上爆發了強烈的質疑聲浪。許多使用者抱怨,Opus 4.7 採用了新的分詞器 (tokenizer),導致相同輸入的 token 消耗量增加了約 1.0 到 1.35 倍(最高達百分之三十五,具體取決於內容類型)。這無疑讓使用者感覺像是一種變相的價格調漲。此外,一項名為 MRCR 的長文本檢索評測數據,居然從 4.6 版本的 78.3% 暴跌至 4.7 版本的 32.2%。雖然 Anthropic 開發人員出面澄清,表示他們更看重實際應用的 Graphwalks 表現,並計畫逐步淘汰 MRCR,但依然難以平息用戶對於模型能力倒退的擔憂。

這時,另一個常見的問題浮出水面:我們該如何面對高達一百萬 token 的龐大上下文視窗?龐大的記憶空間雖然強大,卻也容易造成所謂的上下文腐敗(context rot)。根據 Thariq 在社群平台 X 上的分享,有效管理會話至關重要。當模型開始迷失方向或給出錯誤建議時,果斷使用 /compact 指令來總結對話,或者乾脆開啟新的對話視窗。保留過多不相關的歷史紀錄並非明智之舉,反倒會拖慢模型的推理效率並產生干擾。

你的專屬虛擬助手:Codex 真的能接管你的電腦嗎?

讓我們把目光轉向微軟與 OpenAI 的陣營。對於軟體開發者而言,Codex 的重大更新絕對是一大福音。你知道嗎?它現在已經超越了單純的程式碼輔助工具。

Codex 現在能夠在你工作時,於背景默默運作。它可以看見你的螢幕內容、點擊滑鼠,甚至自己輸入文字。開發者最關心的問題通常是:這種背景運作會干擾我原本的作業嗎?答案是否定的。多個代理程式(agents)可以在你的 Mac 上平行運作,彼此互不干涉。這種設計大幅提升了前端設計與應用程式測試的流暢度。它甚至內建了專屬瀏覽器,能夠直接在網頁上提供精準的修改建議,讓你免去在不同應用程式間來回切換的煩惱。

輕量卻強大:Qwen3.6-35B-A3B 憑什麼脫穎而出?

開源社群同樣不容小覷。阿里巴巴旗下團隊發布了最新的Qwen3.6-35B-A3B。這是一個採用混合專家(MoE)架構的開源模型,引起了廣泛關注。

這款模型雖然總參數量達到 350 億,但實際啟動的參數僅有 30 億左右。讓我解釋一下,這種輕量化的設計,讓它在智能體編程方面的表現,足以媲美體積龐大許多的稠密模型(dense models)。對於想要自行部署高效能模型且預算有限的開發者來說,這是一個極具吸引力的選擇。目前,大家已經可以在Hugging Face 平台直接下載它的模型權重,親自體驗它的威力。

專業領域的守護者:GPT-Rosalind 與網路安全防護網如何改變現狀?

人工智慧的觸角也逐漸延伸到了更專業的科學與安全領域。OpenAI 推出了專為生命科學打造的GPT-Rosalind。這個模型專精於化學、蛋白質工程與基因組學。它能夠協助科學家梳理浩瀚的文獻與複雜的實驗數據,藉此大幅縮短新藥研發的漫長時程。

另一方面,網路安全問題日益嚴峻。為了加強數位基礎設施的防禦能力,OpenAI 宣布了兩項重要舉措。首先,他們透過「網路安全資助計畫 (Cybersecurity Grant Program)投入了一千萬美元的 API 額度,致力於協助開源安全團隊與漏洞研究人員。此外,他們也啟動了「Trusted Access for Cyber」專案,讓世界知名的企業領導者與政府機構(如英美的 AI 安全研究所)能夠安全地存取 GPT-5.4-Cyber 等先進防禦模型。這些計畫的核心理念很簡單:讓最先進的網路防禦能力廣泛普及,主動保護我們共同依賴的數位系統。

告別分頁混亂:Chrome AI 模式與 Gemini 帶來的日常便利

最後,讓我們來看看日常網頁瀏覽的實用升級。Google 為Chrome 瀏覽器引入了全新的 AI 模式。當你在網路上尋找資料時,常常需要不斷切換分頁,對吧?現在,點擊連結後,網頁會與 AI 模式並排開啟。

你可以直接對照網頁內容向 AI 提問,甚至讓 AI 跨越多個已開啟的分頁進行資料搜尋與統整。這讓資訊的吸收與比對變得更加直覺。順帶一提,Google 也針對旗下服務推出了極具吸引力的優惠活動。如果你剛好有訂閱需求,不妨參考 Gemini 官方發布的限時折扣方案。只要符合美國、日本等特定地區資格,就能享有 YouTube Premium 十二個月的折扣優惠;在十二個月期滿後,若選擇與 Google One 組合購買,還能以較低的優惠價格自動續訂。想了解更多細節,可以前往 Google One 活動頁面查看。

科技的演進從未停歇,從程式開發、科學研究到日常網頁瀏覽,AI 正以前所未有的方式融入我們的生活。保持好奇心,善用這些新工具,我們都能在這波浪潮中找到屬於自己的最佳位置。

問與答

關於 Claude Opus 4.7 與上下文管理

Q1: Claude Opus 4.7 的 100 萬 Token 上下文視窗非常強大,但在實際使用上會面臨什麼挑戰?該如何解決? A1: 雖然 100 萬 Token 的上下文視窗能讓模型可靠地處理長時間的任務,但這也帶來了「上下文腐敗 (Context rot)」的風險。當對話越來越長,模型的注意力會被分散,導致舊的、不相關的內容開始干擾當前任務,拖慢推理效率。 為了有效管理,建議可以採用以下策略:

  • 使用 /rewind 糾正錯誤: 當模型嘗試的方法失敗時,與其用文字告訴它「這行不通,改用另一個方法」,不如直接回到模型閱讀檔案後的節點重新下達精準指令,這能避免錯誤嘗試的紀錄干擾未來的判斷。
  • 適時建立新會話: 當進入全新的工作階段時,使用 /clear 搭配總結好的提示詞來開啟新會話,確保上下文保持乾淨。
  • 利用子代理 (Subagents): 對於會產生大量不需要保留之中間結果的任務,可以讓 Claude 衍生出擁有獨立上下文視窗的子代理來處理,最終只將結果回傳給主對話。

Q2: 為什麼許多開發者對 Claude Opus 4.7 的 Token 消耗量感到不滿? A2: 根據社群論壇上的熱烈討論,主要原因是 Opus 4.7 使用了更新的分詞器 (tokenizer),導致相同的輸入文字會被切分成更多的 Token,消耗量大約是前一代的 1.0 倍到 1.35 倍(最高增加約 35%)。此外,Opus 4.7 在處理困難問題時會進行更多深層思考,進而產生更多輸出 Token。這讓許多使用者感覺像是變相漲價,甚至有人抱怨只送了幾個提示就耗盡了額度。

關於 OpenAI Codex 更新

Q3: 最新的 OpenAI Codex 除了輔助撰寫程式碼,還增加了哪些能在背景輔助開發者的功能? A3: 最新的 Codex 已經超越了單純的程式碼補全工具。它現在能夠在背景運作,透過自己的游標來「看見螢幕、點擊和輸入文字」,操作電腦上的各種應用程式。更棒的是,它允許多個代理程式在 Mac 上平行運作,且不會干擾使用者正在進行的其他作業。它甚至內建了瀏覽器,讓開發者可以直接在網頁畫面上留言,給予精確的指示,這大幅提升了前端和遊戲開發的效率。

關於 Qwen3.6-35B-A3B

Q4: 開源模型 Qwen3.6-35B-A3B 為何能在開發者社群中引起廣泛關注? A4: 阿里巴巴團隊推出的 Qwen3.6-35B-A3B 採用了混合專家 (MoE) 架構。它的總參數量雖然達到 350 億,但實際運作時啟動的參數僅有約 30 億。這種極致輕量化、高效能的設計,讓它在「智能體編程 (Agentic Coding)」方面的表現,足以媲美參數量龐大許多的稠密模型(如 Qwen3.5-27B 和 Gemma4-31B)。開發者可以直接在 Hugging Face 或 ModelScope 下載模型權重,輕鬆部署。

關於 GPT-Rosalind 與科學研究

Q5: OpenAI 專門為生命科學領域推出的 GPT-Rosalind 可以解決科學家的什麼痛點? A5: 在美國,新藥從靶點發現到獲准上市平均需要 10 到 15 年,科學家們經常受困於繁雜的文獻、專業資料庫和實驗數據之中。GPT-Rosalind 是專為化學、蛋白質工程和基因組學打造的推理模型。它可以結合開源的生命科學外掛,連接超過 50 種公共資料庫與科學工具,幫助科學家大幅加快文獻回顧、序列分析、實驗規劃等複雜的工作流程,進而加速早期藥物研發的速度。

關於 OpenAI 的網路安全防護網

Q6: OpenAI 如何透過不同的專案計畫來強化整體的網路安全防禦生態? A6: OpenAI 意識到網路安全需要各方合作,因此啟動了兩項重點計畫來普及先進的防禦能力:

  1. 網路安全資助計畫: 投入 1,000 萬美元的 API 額度,專門協助沒有 24 小時安全團隊的開源安全團隊及漏洞研究人員(例如 Socket 和 Semgrep)。
  2. Trusted Access for Cyber 專案: 針對全球知名的企業(如美國銀行、NVIDIA)以及政府機構(如英美 AI 安全研究所),提供安全存取最先進防禦模型(如 GPT-5.4-Cyber)的管道,以主動保護關鍵的數位基礎設施。

關於 Chrome AI 模式

Q7: Google Chrome 的全新 AI 模式如何解決日常網頁瀏覽中「分頁混亂」的問題? A7: 以往我們在網路上尋找資料時,常需要不斷在各個分頁間來回切換比對。現在,當在 Chrome 點擊連結時,網頁可以與 AI 模式並排開啟,讓你在不離開當下頁面的情況下直接向 AI 提問。此外,AI 模式還具備「跨分頁搜尋」的功能,你可以把已開啟的筆記、投影片或 PDF 等多個分頁的內容一併加入搜尋上下文中,讓 AI 幫你跨來源統整資訊並給出更量身打造的解答。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.