news

AI 日報: Claude Sonnet 4.6 強勢升級與 Google Lyria 3 音樂生成登場,OpenAI 聚焦區塊鏈安全

February 19, 2026
Updated Feb 19
2 min read

今天的 AI 科技圈充滿了重磅更新,從生產力工具到娛樂應用都有顯著進展。Anthropic 推出了更強大的 Claude Sonnet 4.6,直接挑戰現有的模型極限;Google 則讓 Gemini 具備了更先進的音樂創作能力,甚至還加強了 NotebookLM 的簡報功能。此外,OpenAI 將目光轉向了區塊鏈安全,而開源社群也迎來了令人驚喜的輕量級語音模型。這篇文章將帶大家瀏覽這些重要的技術突破。


Anthropic 推出 Claude Sonnet 4.6:更聰明、更懂電腦操作的 AI 助手

Anthropic 再次提升了標準,正式發布 Claude Sonnet 4.6。這款模型被官方稱為目前最強大的 Sonnet 版本,它在編碼、電腦操作(Computer Use)、長文本推理以及代理規劃(Agent Planning)等關鍵領域都有了全面性的升級。

對於開發者和重度使用者來說,最令人興奮的消息莫過於 Sonnet 4.6 現在於 Beta 版中支援高達 100 萬個 Token 的上下文視窗。這意味著它可以一次性處理整本小說、龐大的程式碼庫或是繁雜的法律文件,而不會「忘記」前面的內容。目前,這款模型已經成為 claude.ai 和 Claude Cowork 的預設模型,無論是免費用戶還是 Pro 用戶都能直接體驗。

除了基礎能力的提升,Sonnet 4.6 在「電腦操作」技能上也有了長足進步。早在 2024 年 10 月,Anthropic 就引入了讓 AI 像人類一樣操作電腦的概念。如今,經過十六個月的打磨,Sonnet 4.6 在 OSWorld 基準測試中的表現大幅提升。它現在能更流暢地處理像是瀏覽網頁、填寫多步驟表單這類任務,甚至在多個瀏覽器分頁之間切換也難不倒它。雖然它操作電腦的速度和精準度還沒完全達到人類專家的水準,但這已經讓 AI 從單純的「對話者」轉變為能實際幫你執行繁瑣工作的「執行者」。


Google Gemini 整合 Lyria 3:用文字和圖片譜寫你的音樂

如果你覺得只是和 AI 聊天有點單調,那麼 Google 的新功能可能會讓你眼睛一亮。Google 宣佈在 Gemini App 中整合了 DeepMind 最先進的音樂生成模型 Lyria 3。這項功能目前處於測試階段,但它允許任何人透過簡單的文字描述,甚至是上傳一張圖片,來生成一段 30 秒的高品質音樂。

這項技術的有趣之處在於它的多模態特性。你不需要懂樂理,只要告訴 Gemini:「給我一段關於襪子找不到另一半的 R&B 慢歌」,幾秒鐘後,一段包含人聲、旋律和伴奏的音樂就誕生了。甚至,你可以上傳一張自家狗狗在森林裡的照片,要求 AI 配上一段符合情境的配樂。

當然,隨著生成式音樂的普及,版權和安全性也是大家關心的重點。Google 強調,所有由 Lyria 3 生成的音軌都會嵌入 SynthID 浮水印。這是一種人類聽覺無法察覺,但機器可以識別的標記,用來證明這段音訊是由 AI 生成的。這不僅保護了創作者,也讓 AI 內容的識別變得更加透明。目前這項功能已在多個國家推出,並支援多種語言,讓音樂創作變得像傳訊息一樣簡單。


OpenAI 發表 EVMbench:用 AI 守護區塊鏈智能合約

在金融科技領域,智能合約(Smart Contracts)掌管著數千億美元的資產,因此其安全性至關重要。OpenAI 與 Paradigm 合作,推出了一個名為 EVMbench 的新基準測試工具,專門用來評估 AI 代理在區塊鏈環境中檢測、修補和利用漏洞的能力。

EVMbench 的推出,顯示了 OpenAI 正在認真看待 AI 在網路安全防禦上的應用。這個工具包含了 120 個經過策劃的高嚴重性漏洞,大多來自真實的程式碼審計競賽。它的運作模式分為三種:偵測(Detect),看 AI 能否找出合約中的漏洞;修補(Patch),測試 AI 能否在不破壞原有功能的前提下修復漏洞;以及利用(Exploit),這其實是一種「紅隊演練」,看 AI 能否模擬駭客攻擊,以驗證漏洞的真實性。

目前的測試結果顯示,像是 GPT-5.3-Codex 這樣的模型在「利用」模式下表現出色,但在「偵測」和「修補」微妙漏洞方面仍有進步空間。這項研究的核心目的是鼓勵開發者利用 AI 進行防禦性審計,在合約部署前就找出潛在風險,而不是等到駭客攻擊後才亡羊補牢。


NotebookLM 重大更新:一句話就能修改簡報

Google 的筆記與研究助手 NotebookLM 也在今天迎來了用戶敲碗已久的功能更新。現在,使用者可以透過自然語言提示(Prompt)直接修改生成的投影片內容。

過去,如果 AI 生成的投影片風格不對或重點偏差,用戶往往需要手動逐頁調整。現在,你只需要輸入「把所有標題改成更活潑的語氣」或是「精簡第三頁的文字」,系統就會自動幫你完成修訂。此外,NotebookLM 終於支援匯出為 PPTX 格式,這對於習慣使用 PowerPoint 進行簡報的職場人士來說,無疑是一大福音(Google Slides 的支援也即將推出)。這讓從資料整理到最終展示的流程變得更加順暢。


Kitten ML 釋出超輕量級開源 TTS 模型:小到能在任何設備運行

還記得先前的KittenTTS嗎?對於喜歡折騰本地端 AI 應用的開發者來說,Kitten ML 的新發布絕對值得關注。他們開源了三款極其輕量的語音合成(TTS)模型:Kitten TTS

這些模型(Mini 80M、Micro 40M、Nano 14M)的特點就是「小」。最小的 Nano 版本僅有 1400 萬參數,檔案大小不到 25MB。這意味著你不需要昂貴的 GPU,甚至在樹莓派或舊手機這類邊緣設備上,僅靠 CPU 就能流暢運行高品質的語音生成。

這組模型提供了 8 種富有表現力的聲音(4 男 4 女),並且在 Apache 2.0 許可下完全免費商用。這打破了過去高品質 TTS 往往依賴雲端 API 的限制,為本地端語音助手、離線應用程式開啟了新的可能性。


Google AI 影響力峰會:150 億美元投資基礎建設與人才

最後,我們將視角拉到印度。在 Google AI 影響力峰會 上,Google 宣佈了一系列旨在縮小數位落差的重大計畫。這包括在印度投資 150 億美元建設 AI 基礎設施,以及推出「美印連結倡議」(America-India Connect initiative),透過新的海底光纜增強南半球的網路韌性。

除了硬體建設,Google 也承諾投入資源培育人才,包括與印度政府合作培訓數百萬名公務員使用 AI 工具,以及為全球研究人員提供資金,支持他們利用 AI 解決氣候變遷和醫療健康等複雜問題。這些舉措顯示,科技巨頭在推動產品創新的同時,也正試圖確保 AI 的紅利能更公平地惠及全球各地。


常見問題解答 (FAQ)

Q:Claude Sonnet 4.6 是免費的嗎? A:是的,Claude Sonnet 4.6 目前是 claude.ai 免費用戶和 Pro 用戶的預設模型。不過,免費用戶在使用次數和速率上可能會有較多限制。

Q:我可以在哪裡使用 Google 的 Lyria 3 來創作音樂? A:Lyria 3 目前已經整合進 Gemini App 中。如果你所在的地區支援該功能,你只需要在 App 中輸入文字提示或上傳圖片,即可開始創作音樂。

Q:NotebookLM 匯出的 PPTX 檔案可以在 Keynote 或 LibreOffice 中打開嗎? A:通常 PPTX 是通用的簡報格式,Keynote 和 LibreOffice Impress 等軟體都能開啟,但排版可能會有些微差異,建議使用 PowerPoint 開啟以獲得最佳效果。

Q:Kitten TTS 的模型支援中文嗎? A:根據目前的發布資訊,Kitten TTS V0.8 版本主要支援英文,但官方表示未來版本將會加入多語言支援。由於它是開源的,社群或許也會很快推出其他語言的微調版本。

分享至:
Featured Partners

© 2026 Communeify. All rights reserved.