news

AI日報|DeepSeek API 降價、Agentic RAG 評測、Bumblebee 與 Confucius4-TTS 開源

May 25, 2026
Updated May 25
1 min read

AI 焦點快遞:Anthropic 揪出上萬漏洞與 DeepSeek 價格震撼彈

每天都有新的技術突破,讓人目不暇給。你知道嗎?最近的技術發展似乎又來到了一個新的轉折點。從網路安全防護的自動化,到語言模型定價的瘋狂下殺,每一項消息都牽動著無數開發者的心。

事情是這樣的,今天為大家整理了六大不容錯過的焦點新聞。這裡包含各種最新的評測數據與開源工具。讓我們一起來看看這些新技術如何重塑未來的開發工作。

網路安全新防線:Anthropic Project Glasswing 首月抓出上萬漏洞

軟體漏洞一直是工程師的心頭大患。說實話,找出程式碼裡的隱患往往需要耗費大量時間與精力。Anthropic 發布的 Project Glasswing 最新進展帶來了令人振奮的消息。這個計畫旨在利用人工智慧模型來保護全球關鍵軟體的安全。

透過使用 Claude Mythos Preview 模型,大約五十個合作夥伴在第一個月內就發現了超過一萬個高風險或嚴重漏洞。這聽起來很驚人對吧?以知名企業 Cloudflare 為例,他們的團隊在關鍵路徑系統中找到了兩千個錯誤,其中四百個屬於高危險級別。而且 Cloudflare 團隊認為,模型的誤報率甚至比人類測試員還要低。

這裡出現了一個有趣的現象。過去軟體安全的瓶頸在於尋找漏洞的速度,現在反而變成了驗證與修復漏洞的速度。由於 AI 產生的錯誤報告如雪片般飛來,許多開源專案維護者表示他們的處理量能已經到達極限。這意味著整個科技產業必須縮短修補週期,並善用自動化工具來協助修復程式碼。

開發者福音!DeepSeek-V4-Pro 震撼宣佈優惠變永久定價

誰不喜歡降價呢?尤其是在運算成本高昂的環境下,每一次的價格調整都可能改變企業的產品策略。DeepSeek 宣布將 DeepSeek-V4-Pro API 2.5 折優惠轉為永久定價,這無疑在開發者社群中投下了一顆震撼彈。

讓我來解釋一下具體的細節。原本這個高達 75% 的折扣活動預計延長至 2026 年 5 月 31 日,但在這之後,官方會直接將原定價調降為四分之一。這代表現在的超低優惠價將會成為未來的常態價格。真的是非常便宜,便宜到讓人難以置信。

具體來看,如果命中快取 (Cache hit),輸入成本僅需每百萬 Token 0.003625 美元。即使未命中快取,輸入也只要 0.435 美元,輸出則是 0.87 美元。大幅降低的成本門檻將讓更多新創團隊與個人開發者能夠毫無顧忌地採用強大的大型語言模型,進而催生出更多創新的應用服務。

究竟該選誰?Agentic RAG 與長脈絡 LLM 的直球對決

大家可能會好奇,面對長篇大論的文件,到底該把整份文件塞進模型,還是使用檢索增強生成技術 (RAG) 呢?SurfSense 針對 Agentic RAG 與長脈絡 LLM 進行了一項詳細評測。這份測試使用了 Claude Sonnet 4.5 模型,針對三十份複雜且包含大量圖片的 PDF 檔案提出了 171 個真實問題。

測試結果非常耐人尋味。如果單看原始準確率,將完整文件解析後輸入模型的作法拔得頭籌 (59.6%)。不過 Agentic RAG 的表現也相當緊咬 (53.2%)。最關鍵的差異在於成本與穩定性。Agentic RAG 每次查詢的成本不到完整輸入的一半 (0.0827 美元對比約 0.20 美元),而且在 171 次查詢中達到了零失敗的驚人紀錄。

另外一個打破迷思的發現是,直接讓具備視覺能力的模型閱讀原始 PDF 的表現最差 (52.0%)。這證明了傳統的 OCR 與版面解析技術目前依然無法被輕易取代。對於預算有限且需要處理海量文件的企業來說,Agentic RAG 仍然是最務實且穩健的選擇。

解放雙手:Claude Auto Mode 迎來兩大重要升級

對於經常使用 Claude 撰寫程式碼的開發者來說,自動模式 (Auto mode) 絕對是一個提升效率的神兵利器。Claude Devs 宣布了關於 Auto mode 的兩項重要更新

現在這項功能已經正式開放給 Pro 方案的使用者。更令人興奮的是,除了原本支援的 Opus 4.7 之外,目前也加入了對 Sonnet 4.6 的支援。Sonnet 4.6 以其卓越的反應速度與邏輯推演能力聞名,這將讓自動完成複雜任務的流程變得更加順暢。

使用者只需要按下 Shift+Tab 組合鍵,就能讓 Claude 自動接管並執行後續的工作。這種無縫的互動體驗,就像是身邊多了一個不知疲倦的程式設計助手。

強化供應鏈安全:Perplexity 開源內部檢測工具 Bumblebee

這幾年軟體供應鏈攻擊事件層出不窮,任何一個不起眼的套件更新都可能隱藏著惡意程式碼。Perplexity 宣布開源其內部使用的安全掃描工具 Bumblebee。這個舉動對於防禦日益複雜的網路威脅有著重大的意義。

Bumblebee 是一個唯讀的掃描程式。它的設計初衷是在發生供應鏈安全事件時,迅速檢查開發者的電腦中是否存在具有風險的套件、擴充功能或 AI 工具設定。目前這個工具支援三種掃描模式,包含日常檢查的基準模式、針對特定工作區的專案模式,以及應對突發事件的深度掃描模式。

Bumblebee 最大的優勢在於它絕不會執行安裝腳本或生命週期掛鉤。許多新興的惡意軟體會在開發者執行套件安裝的瞬間觸發,而 Bumblebee 透過直接讀取中介資料來避免這個問題,確保掃描過程本身不會成為引發資安危機的導火線。這項以 Go 語言編寫的開源專案,目前已可供 macOS 與 Linux 系統的開發者下載使用。

零樣本語音生成新星:網易有道推出 Confucius4-TTS

語音合成技術的發展速度同樣令人驚豔。網易有道最新釋出的專案吸引了眾多開源愛好者的目光。Confucius4-TTS 是一個多語種且支援跨語言的零樣本語音合成引擎

這個系統採用了語音編碼器結合大型語言模型的架構。它不需要任何參考文字就能進行無限制的語音複製。目前 Confucius4-TTS 已經支援包含中文、英文、日文與德文等十四種語言,並且能在不同語言之間進行無口音的語音轉換。

更特別的是它的情感轉移能力。它不僅能複製聲音的特質,還能精準捕捉並重現說話者的情緒起伏。有興趣的朋友可以前往 Gradio 線上體驗區 試玩,或是直接造訪 Confucius4-TTS 的 GitHub 頁面 了解更多程式碼細節與模型權重資訊。


常見問題解答 (FAQ)

1. 什麼是 Agentic RAG,它和傳統的 RAG 有什麼不同?

Agentic RAG 是由語言模型代理程式 (Agent) 主導的檢索增強生成技術。傳統 RAG 只有單一固定的檢索步驟,而 Agentic RAG 允許代理程式自行提出子問題、執行多次不同的搜尋、判斷何時收集到足夠的證據,並過濾掉不相關的資訊。這就像是派一位研究助理去圖書館,讓他反覆在書架間穿梭比對資料,直到寫出完整的報告為止。

2. 為什麼 DeepSeek 的定價策略會引起這麼大的關注?

因為成本是決定技術能否普及的關鍵因素。DeepSeek 將原本的促銷折扣轉為永久定價,讓輸入命中快取的成本降至極低的水準。這大幅減輕了企業與開發者在處理長篇文本或頻繁呼叫 API 時的財務負擔,有助於推動更多 AI 應用的落地。

3. Project Glasswing 發現了這麼多漏洞,這代表現有的軟體很不安全嗎?

可以這麼說。這凸顯了現代軟體架構中潛藏著許多尚未被發現的危險。不過,能用 AI 找出這些漏洞其實是一件好事。目前的挑戰已經從「如何發現問題」轉變為「如何及時修復問題」,這需要開發者縮短修補週期並善用 AI 工具來協助生成修復程式碼。

4. 我應該完全依賴視覺語言模型來處理 PDF 檔案嗎?

根據目前的評測數據,答案是否定的。直接讓模型讀取長篇且包含複雜排版的 PDF 檔案,不僅成本高昂,失敗率也相對較高。在實際的生產環境中,採用優質的 OCR 系統進行預處理,再結合檢索技術,依然是兼顧準確率與預算的最佳方案。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.