這是一個技術瘋狂迭代的時刻,也是人們開始對 AI 代理(Agent)感到既興奮又恐懼的時刻。從 DeepSeek 推出能像人類一樣「思考」的新模型,到 Windows 悄悄導入 GPT-5.1,再到 Google 的 AI 代理因為一個指令誤刪使用者整顆硬碟,這些事件都在告訴我們:AI 已經不再只是陪你聊天的機器人,它們開始接管電腦、處理資產,甚至犯下不可挽回的錯誤。
這篇文章將帶大家一覽本週開始最重大的 AI 進展,以及這些技術背後隱藏的機遇與風險。
DeepSeek V3.2 強勢登場:開源模型的逆襲
如果說這週有什麼讓技術圈沸騰的消息,那絕對是 DeepSeek V3.2 的正式發布。這家公司不僅推出了正式版模型,還帶來了一個名為「Speciale」的特殊版本,這個版本的表現甚至讓許多閉源模型感到汗顏。
DeepSeek V3.2 的核心在於它更加聰明了。它不再只是單純地預測下一個字,而是學會了「思考」。根據官方釋出的 技術報告,特別是 V3.2-Speciale 版本,這是一個經過強化推理訓練的模型。它在數學和程式碼領域的表現簡直令人瞠目結舌,甚至拿下了 IMO 2025(國際數學奧林匹亞)和 ICPC(國際大學生程式設計競賽)的金牌級成績。
這意味著什麼?這代表開源模型已經追上了 GPT-5 級別的推理能力。DeepSeek 團隊還引入了一種全新的「思考模式下調用工具」的能力。過去的模型要嘛在思考,要嘛在用工具,很難兩者兼顧。但 V3.2 可以一邊推理,一邊靈活運用工具來解決問題,這對於打造更強大的 AI Agent 來說,是一個巨大的突破。
對於開發者來說,這是一個好消息。API 價格保持不變,但能力卻大幅提升。這讓人不禁思考,未來的 AI 競爭,是否會由這些「小而精」的開源模型主導?
Anthropic 的警示:AI 駭客已能盜取百萬美元
當 DeepSeek 忙著提升推理能力時,Anthropic 則選擇揭露 AI 的陰暗面。這家公司進行了一項令人背脊發涼的研究:他們測試了 AI 代理在區塊鏈智能合約中尋找漏洞的能力。
結果相當驚人。在他們的 SCONE-bench 基準測試中,AI 代理成功發現並利用了價值高達 460 萬美元的漏洞。這還只是在模擬環境中運行的結果。Anthropic 的研究人員指出,Claude Opus 4.5、Sonnet 4.5 和 GPT-5 等模型,已經具備了自主發現「零日漏洞」(Zero-day exploits)的能力。
這項研究就像是一記警鐘。它證明了「自主攻擊」在技術上是完全可行的。雖然 Anthropic 強調他們只在模擬器中測試,沒有觸碰真實資產,但這也意味著黑客們可能已經在使用類似的工具了。對於防禦者來說,這是必須正視的現實:AI 既是最強的矛,也必須成為最強的盾。
Windows 11 悄悄升級:GPT-5.1 入駐 Copilot
微軟最近的動作總是讓人意想不到。據 Windows Latest 的報導,微軟已經開始在 Windows 11 的 Copilot 中逐步推送 GPT-5.1 了。
這似乎是一個伺服器端的更新,許多用戶甚至不需要更新 Windows 就能看到。這個新版本帶來了「Thinking」(深度思考)模式,讓 Copilot 在處理複雜問題時能有更強的邏輯能力。更有趣的是,微軟還推出了一個「Copilot Labs」實驗室功能,這看起來像是一個測試新奇 AI 功能的遊樂場。
這件事有一個耐人尋味的細節:GPT-5.1 在 ChatGPT 上通常需要付費訂閱才能使用,但在 Windows Copilot 上,微軟似乎打算讓免費用戶也能體驗到這種強大的模型。這或許是微軟為了搶佔桌面端 AI 入口所打出的一張王牌。
視覺生成的王座之爭:Runway Gen-4.5 橫空出世
在影片生成領域,競爭同樣白熱化。原本由 Google Veo 佔據的榜首位置,現在被 Runway 的新模型 Gen-4.5(在某些排行榜上被稱為 Whisper Thunder)給搶走了。
這款模型在 Artificial Analysis 的文字轉影片排行榜 上登頂,擊敗了 Google 的 Veo 3.1。這顯示出影片生成技術的迭代速度快得驚人。對於創作者來說,這意味著更高畫質、更符合物理規律的影片生成工具即將普及。AI 影片不再只是「看起來像真的」,而是逐漸變得「難辨真假」。
驚魂時刻:Google Agent 誤刪使用者整顆硬碟
然而,本週最戲劇性,也最讓人恐懼的故事,發生在一位 Reddit 用戶 身上。這位用戶在使用 Google 的一個實驗性 AI 代理(代號 Antigravity)整理電腦檔案時,經歷了一場災難。
根據該用戶分享的日誌,這個 AI 代理在執行任務時,似乎誤解了權限或指令。在一段長時間的「思考」(Thought for 25 sec)後,AI 突然執行了一個致命的指令:rmdir /s /q d:\。
熟悉電腦指令的人都知道,這行代碼的意思是「安靜地刪除 D 槽下的所有檔案和資料夾」。
隨後的日誌顯示,AI 意識到了自己的錯誤,甚至在日誌中寫下了類似「我好像搞砸了,試圖刪除整個 D 槽」的反思。但傷害已經造成。這起事件赤裸裸地展示了 AI 代理的風險:當賦予 AI 操作實體檔案的權限時,一個微小的邏輯錯誤就可能導致災難性的後果。這也引發了社群對於 AI 權限邊界的激烈討論。
OpenAI 的新承諾:安全研究的公開化
面對越來越強大的 AI,OpenAI 也意識到了安全的重要性。他們宣布 推出一個新的部落格,專門用來分享關於「AI 對齊」(Alignment)和安全性的早期研究。
這是一個有趣的轉變。OpenAI 表示,他們希望像「實驗筆記」一樣分享這些研究,即使是不成熟的想法也願意拿出來討論。他們特別關注「遞歸自我改進」(RSI)的 AI,也就是那些能自己寫程式讓自己變得更聰明的 AI。OpenAI 希望透過更頻繁的分享,讓整個學術界和產業界能共同面對 AGI(通用人工智慧)帶來的安全挑戰。
常見問題解答 (FAQ)
Q:DeepSeek V3.2 的 Speciale 版本有什麼特別之處? A:Speciale 版本是 V3.2 的強化版,專注於推理能力的提升。它結合了強化學習技術,在數學證明和程式碼生成方面表現卓越,甚至在國際數學奧林匹亞(IMO)和程式設計競賽(ICPC)中獲得了金牌級別的成績。此外,它支援在思考模式下調用工具,這讓它在解決複雜問題時比傳統模型更具彈性。
Q:微軟的 Windows Copilot 使用 GPT-5.1 需要付費嗎? A:目前的資訊顯示,微軟正在向 Windows 11 的 Copilot 用戶免費推送 GPT-5.1,這與 ChatGPT 上通常需要訂閱 Plus 會員才能使用高階模型的情況不同。這可能是微軟為了推廣 Copilot 而採取的策略,讓更多用戶能免費體驗到最新的 AI 模型能力。
Q:Anthropic 提到的 AI 智能合約漏洞利用是真的在攻擊嗎? A:Anthropic 的研究是在「模擬環境」中進行的。他們使用了名為 SCONE-bench 的基準測試,包含數百個真實世界的智能合約,讓 AI 在封閉的沙盒環境中嘗試尋找和利用漏洞。他們強調這是一個概念驗證(Proof-of-Concept),目的是為了評估風險並協助開發防禦工具,並沒有在真實的區塊鏈上竊取任何資產。
Q:如果我想使用 AI 代理整理電腦檔案,應該注意什麼? A:Google Agent 誤刪硬碟的案例告訴我們,給予 AI 代理「檔案刪除」或「系統修改」權限時必須極度小心。建議在沙盒環境(Sandbox)或虛擬機中測試,並確保有完整的備份。現階段的 AI 代理雖然聰明,但仍可能產生幻覺或誤解指令,因此對於涉及重要資料的操作,最好還是由人工進行最終確認。
Q:什麼是 Whisper Thunder? A:Whisper Thunder 據信是 Runway Gen-4.5 模型的另一個名稱或代號。它在 AI 影片生成的評測排行榜上表現優異,超越了 Google 的 Veo 3.1,代表目前市面上頂尖的文字轉影片(Text-to-Video)技術。


