
DMflow.chat
廣告
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
Anthropic 正式發表新一代 Claude 模型:Claude Opus 4 與 Claude Sonnet 4!探索它們在編碼、進階推理及 AI 代理方面的強大升級,以及 Claude Code 和全新 API 功能如何賦能開發者。
大家可能都感覺到了,AI 技術的進步速度真是快得讓人目不暇給!就在今天,Anthropic 又為我們帶來了重磅消息:全新一代的 Claude 模型——Claude Opus 4 和 Claude Sonnet 4 正式登場!這可不是簡單的小改款,它們的目標是為程式編碼、進階邏輯推理,以及 AI 代理的應用樹立全新的業界標竿。準備好了嗎?讓我們一起來看看 Claude 4 究竟有哪些過人之處!
這次 Anthropic 一口氣推出了兩款主力模型,它們就像是武功高強的兄弟,各自擅長不同的領域,但都同樣令人驚艷。
首先登場的是 Claude Opus 4。Anthropic 宣稱它是目前世界上最強的編碼模型,聽起來就很厲害對吧?它特別擅長處理那些需要長時間專注、步驟繁瑣的複雜任務,以及各種 AI 代理的工作流程。它的能耐可不是說說而已,許多業界的先行者都已經對它讚不絕口:
聽起來,Opus 4 簡直就是開發者夢寐以求的超級夥伴啊!
另一位主角是 Claude Sonnet 4。它是 Sonnet 3.7 的重大升級版,同樣在編碼和推理能力上帶來了卓越的表現。更重要的是,它能更精準地理解並回應你的指令。Anthropic 表示,Sonnet 4 在強大功能和日常實用性之間取得了絕佳的平衡。
雖然在某些最高難度的領域可能不及 Opus 4,但 Sonnet 4 在應對日常使用案例時,其表現絕對是頂尖的。不少公司也給予了高度評價:
所以說,無論是追求極致效能的 Opus 4,還是兼顧實用與高效的 Sonnet 4,都能為 AI 策略帶來全面提升。
好消息是,儘管功能大幅躍進,Claude 4 系列的定價策略依然與前代 Opus 和 Sonnet 模型保持一致。具體來說,Opus 4 的輸入/輸出價格為每百萬 token 15美元/75美元,而 Sonnet 4 則是 3美元/15美元。
你可以在 Anthropic API、Amazon Bedrock 以及 Google Cloud 的 Vertex AI 上使用這兩款模型。更棒的是,Sonnet 4 也將提供給免費用戶使用!這無疑大大降低了大家體驗頂尖 AI 的門檻。
除了模型本身的強大,Claude 4 還帶來了一系列令人興奮的新功能和改進。這些可不是錦上添花,而是實實在在的能力提升。
想像一下,如果 AI 在思考問題時,還能像我們一樣上網查資料、使用計算機,那該有多強大?Claude 4 的兩款模型現在都具備了「擴展思考與工具使用」的 Beta 功能。
這代表什麼呢?簡單來說,Claude 可以在深度思考的過程中,運用像是網頁搜尋這類的外部工具來輔助。它可以在推理和工具使用之間靈活切換,從而給出更全面、更精準的回應。這就像給 AI 配備了一個外接大腦和萬能工具箱!
新模型在理解和執行任務方面也更上一層樓:
對於廣大開發者來說,Claude Code 現已正式普遍可用!在先前的研究預覽階段,Claude Code 收到了大量正面回饋。現在,Anthropic 進一步擴展了開發者與 Claude 協作的方式。
Claude Code 現在支援透過 GitHub Actions 執行背景任務,並且能夠與 VS Code 和 JetBrains 這兩大主流 IDE 進行原生整合。這代表 Claude 提出的程式碼修改建議會直接顯示在你的檔案中,讓配對編程 (pair programming) 體驗更加流暢自然。
為了讓開發者能夠建構出更強大的 AI 代理,Anthropic API 也同步釋出了四項全新功能:
這些新工具無疑為開發者打開了更廣闊的想像空間。
說了這麼多,Claude 4 的實際表現到底如何呢?讓我們來看看一些硬核的數據。
在業界公認的軟體工程任務基準測試 SWE-bench Verified 上,Claude 4 模型展現了領先的實力。根據 Anthropic 公布的數據(見下圖,基於平行測試時間計算):
在另一個衡量標準 Terminal-bench 上,Opus 4 也取得了 43.2% / 50.0% 的好成績。這些數據充分證明了 Claude 4 在編碼領域的強悍實力。
除了硬指標的提升,Claude 4 在「行為」上也變得更成熟了。
驚人的記憶能力實例:前面提到模型在存取本機檔案時記憶力會提升,這裡有一個超酷的例子!當開發者讓 Opus 4 存取本機檔案來玩《Pokémon》(寶可夢)遊戲時,Opus 4 竟然能夠創建並維護一個名為「導航指南 (Navigation guide)」的記憶檔案,用來記錄關鍵資訊,例如「卡關排除協議 (Getting Unstuck Protocol)」,裡面寫著像是「同樣方法最多嘗試5次」、「如果卡住,嘗試相反的方法」等筆記。這些筆記可是 Opus 4 在玩遊戲時自己記錄下來的真實內容喔!是不是很像一個認真的玩家在做攻略筆記?
現在普遍可用的 Claude Code,正致力於將 Claude 的強大能力更深入地融入開發者的日常工作流程中——無論你習慣在終端機、你最愛的 IDE 中工作,還是在背景執行任務。
Anthropic 為 VS Code 和 JetBrains 推出了全新的 Beta 版擴充功能,可以直接將 Claude Code 整合到你的 IDE 中。Claude 提出的編輯建議會直接內嵌在你的檔案裡,簡化了審查和追蹤流程,一切都在你熟悉的編輯器介面中完成。只需要在你的 IDE 終端機中執行安裝指令,就能輕鬆上手。
更進一步,Anthropic 還釋出了一個可擴展的 Claude Code SDK。這代表什麼呢?這代表你可以使用與 Claude 相同的核心代理來建構屬於你自己的客製化 AI 代理和應用程式!
為了展示 SDK 的可能性,Anthropic 還釋出了一個範例:Claude Code on GitHub (目前為 Beta 版)。你可以透過在 Pull Requests (PRs) 中標記 Claude Code,讓它回應審查者的回饋、修復持續整合 (CI) 錯誤,或是修改程式碼。
Anthropic 認為,Claude 4 這些模型是朝著實現「虛擬協作夥伴」這個目標邁出的一大步。它們能夠在更長遠的專案中保持完整的上下文理解和專注力,並帶來深遠的影響。
當然,強大的能力也伴隨著責任。Anthropic 強調,這些模型都經過了廣泛的測試和評估,以最大限度地降低風險並提升安全性,其中包括了為達到更高 AI 安全級別(如 ASL-3)而實施的各項措施。
Anthropic 對大家將會創造出什麼樣的應用充滿期待!
一如既往,你的回饋對 Anthropic 至關重要,能幫助他們不斷改進。
一站整合多平台聊天,體驗真人與 AI 自由切換的新境界!支援 Facebook、Instagram、Telegram、LINE 及網站,結合歷史記錄、推播通知、行銷活動及客服轉接,全面提升效率與互動。
Google Veo 3 影片模型大解禁!Gemini App 全球擴展,但「以假亂真」的隱憂也浮現? Google 最新 AI 影片生成工具 Veo 3 迅速在全球擴展,用戶驚嘆其「神...
Google DeepMind Lyria2 震撼登場:AI 即時譜寫你的音樂狂想曲,高傳真音質顛覆創作想像! Google DeepMind 最新 AI 音樂生成模型 Lyria2 正...
Google Beam橫空出世:2D視訊一秒變3D!跟「尷尬」眼神說掰掰,即時翻譯讓你聊遍全球! 想像一下,開會不用再盯著冷冰冰的螢幕,而是像跟真人面對面一樣自然交流?Google最新發...
Claude AI 網頁搜尋功能「突襲」免費開放!你的 AI 助理即時戰力大升級 Anthropic 旗下 AI 助理 Claude 再次震撼市場!原本僅限付費用戶的網頁搜尋功能,現在全...
AI界風雲變色!Anthropic 為何拒絕 Windsurf 使用 Claude 4?商戰大戲上演中! Anthropic 最新 AI 模型 Claude Sonnet 4 與 Opu...
風起了!Windsurf SWE-1 系列震撼登場:不只寫程式,搞定整個軟體工程,效率直飆99%! Windsurf 正式發表其首款自主研發的 AI 模型家族 SWE-1 系列,專為軟體...
Meta推出AI影片生成器:挑戰OpenAI和Google,人工智能競賽再升溫 描述 Facebook母公司Meta推出全新AI工具Movie Gen,可根據文字提示生成或編輯影片。這項技術不...
OpenAI 最新基準測試:AI 程式設計能力達到人類四分之一,揭示現有限制 近年來,AI 在程式設計領域的應用越來越廣泛,但它到底能做到什麼程度?最近,OpenAI 公布了一項重要報告...
WordPress 放大絕!一句話打造專屬網站?AI 助手讓你跟架站煩惱說掰掰! 厭倦了複雜的網站架設流程?WordPress 推出革命性 AI 網站建置工具,只要一句話描述你的想法,A...
By continuing to use this website, you agree to the use of cookies according to our privacy policy.