news

AI 日報: 國防合約爭議、Gemini 安全漏洞與模型最新進展

March 2, 2026
Updated Mar 2
1 min read

你知道嗎?最近這幾天的人工智慧領域,可說是充滿了戲劇性的發展。從科技巨頭與政府軍方之間的激烈交鋒,再到看似無害的開發工具突然變成巨大的安全漏洞,每一件事都牽動著整個產業的發展走向。這邊就帶大家仔細梳理一下這些重要事件的脈絡。

國防合約引發的 AI 企業選邊站

這幾天最引人注目的新聞,絕對是 Anthropic 與美國戰爭部之間的激烈衝突。Anthropic 在 2 月 26 日發表了一份關於美國戰爭部討論的公開聲明,表明他們拒絕妥協兩條核心底線,也就是禁止將技術用於大規模國內監控,以及禁止用於完全自主的武器系統。這家公司甚至為此放棄了數億美元的潛在收入。

(Anthropic 其實一直積極支持美國國防,甚至是第一家將模型部署在美國政府機密網路中的前沿 AI 公司。他們也曾為了防堵中國共產黨相關企業,放棄過數億美元的收入。)

這件事情隨即引發了強烈的連鎖反應。美國戰爭部部長 Pete Hegseth 隨後宣布將 Anthropic 列為「供應鏈風險」。面對這種通常只針對敵對國家企業的嚴厲指控,Anthropic 也不甘示弱。他們在 2 月 27 日發布了回應 Pete Hegseth 言論的正式聲明,強調會循法律途徑挑戰這項決定,絕不退讓。

有趣的事情來了。就在這場風波越演越烈之際,OpenAI 卻在隔天宣布他們已經與五角大廈達成了合作協議。或許有人會問,為什麼 OpenAI 能順利簽約?根據他們公布的戰爭部合作協議內容,OpenAI 其實也堅持了相同的紅線,禁止技術應用於國內監控與自主武器。他們能夠順利過關的關鍵,在於採用了「純雲端」的部署架構。這種方式排除了邊緣設備的應用可能,讓自主武器無法直接運作。此外,他們還保留了完整的安全防護機制與人員審查權限(通過安全審查的 OpenAI 工程師與對齊研究員 (cleared safety and alignment researchers))。這也凸顯了不同企業在處理政府關係與技術限制時的策略差異。

看似無害的 API 密鑰竟然成為安全漏洞?

既然聊到了企業級的技術應用,大家絕對不能忽視基礎建設的安全性。Truffle Security 最近揭露了一個極為嚴重的設計缺陷。這份名為Google API 密鑰曾經不是機密但 Gemini 改變了規則的報告指出,許多開發者過去放在網站前端的公開密鑰,現在居然可以直接用來存取 Gemini API。

(Google 一開始收到回報時,其實拒絕承認這是漏洞,將其視為「預期行為 (Intended Behavior)」。直到安全團隊出示了 Google 自家產品公開網頁也被抓到暴露 API 密鑰的證據後,Google 內部才轉變態度,將其升級為 Bug 並著手修補。)

這到底會造成什麼具體影響?老實說,後果非常嚴重。過去 Google 官方文件明確告訴大家 Firebase 或 Maps 的 API 密鑰不需要保密。如今只要同一個專案啟動了 Gemini 服務,那些早已暴露在外的密鑰就獲得了權限升級。駭客甚至不需要碰到你的伺服器,只要從網頁原始碼複製這串字元,就能讀取你上傳的私人檔案,或是狂刷 API 呼叫次數,讓你的帳單瞬間爆表。Truffle Security 在公開網路上掃描到了將近三千把這樣的高危險密鑰,其中甚至包含 Google 自家產品的網頁。這提醒了所有開發團隊,必須立刻盤點並輪替那些老舊的憑證。

說到 Google 的開發工具,最近他們也讓不少工程師感到頭痛。Google 在官方論壇發布公告,要求開發者在 2026 年 3 月 9 日之前從 Gemini 3 Pro Preview 遷移到 Gemini 3.1 Pro Preview。不少社群成員抱怨,新的 3.1 版本在特定任務上常常出現延遲超時的問題,甚至在寫作或幽默感表現上不如舊版。這對於急需穩定服務的應用程式來說,確實是一個不小的困擾。

工作流程的無縫接軌與擴張

接下來把目光轉向那些能讓生活更輕鬆的實用工具。Claude 最近推出了一個非常貼心的新功能,讓使用者可以直接匯入其他 AI 服務的記憶。具體該怎麼操作呢?只要將專用提示詞貼到你原本使用的聊天室中,把生成的結果複製貼上到 Claude 的設定裡,它就會自動更新並記住你的工作習慣與偏好。這對於想要轉換平台卻又捨不得過去幾個月累積對話脈絡的人來說,絕對是一大福音。目前這項功能已經對所有付費方案的用戶開放。

此外,Noah Zweben 也在社群平台上宣布了 Claude Code 的全新遠端控制功能。這個針對 Max 方案用戶推出的預覽版功能,只要輸入 /remote-control 指令,就能將終端機上的本機對話進度無縫轉移到手機上。想像一下這個畫面,當寫程式遇到瓶頸時,大可直接離開座位去散個步,牽著狗去曬曬太陽,同時還能在手機上繼續推進原本的工作。這種打破空間限制的開發體驗,確實非常吸引人。

程式碼生成技術與小模型的逆襲

最後來看看模型訓練的最新進展。Cognition 團隊剛剛發布了 SWE-1.6 早期預覽版。這個專注於軟體工程任務的模型,在維持每秒 950 個詞元生成速度的同時,於 SWE-Bench Pro 測試評估中取得了比上一代高出 11% 的成績。團隊在文章中提到,他們透過擴展強化學習的基礎設施,讓模型學會了更長時間的思考。不過他們也坦承,這種訓練方式偶爾會導致模型過度思考,陷入無意義的自我驗證迴圈。這也是未來提升使用者體驗時需要克服的難題。

與此同時,開源社群也傳來了令人振奮的消息。根據 Casper Hansen 的社群貼文預測,Qwen3.5 的小型號版本即將問世,可能會涵蓋 9B、4B、2B 甚至 0.8B 等規格。這有什麼了不起的?並非只有龐然大物才能解決複雜問題,一個 9B 大小的模型,其表現有可能擊敗上一代高達 80B 的大型版本,反之 4B 模型在多模態推論上也可能超越 30B 的舊模型。這意味著購買硬體設備的投資報酬率正在急遽攀升,未來即使是消費級的顯示卡,也能跑出令人驚豔的運算結果。

回顧這幾天的產業變化,從國防合約的道德拉扯,到日常工具的安全維護,人工智慧的發展軌跡早已不僅僅是單純的技術升級,更牽涉到複雜的商業考量與社會影響。保持對這些資訊的敏感度,才能在這股浪潮中站穩腳步。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.