Qwen3-Coder:挑戰 Claude Sonnet 4,阿里通義千問釋出最強程式碼模型

阿里雲通義千問團隊正式發布 Qwen3-Coder,這款擁有 4800 億參數的 MoE 模型在程式碼和 Agentic 任務上表現卓越,原生支援 256K 超長上下文,性能直逼 Claude Sonnet 4。本文將深入解析其技術細節、訓練過程與實際應用。


程式碼大模型領域的重磅玩家登場

就在最近,阿里雲通義千問團隊投下了一枚震撼彈,正式宣布推出他們迄今為止最強大的「智慧體程式設計模型」 (Agentic Code Model) — Qwen3-Coder

這次發布的明星產品是 Qwen3-Coder-480B-A35B-Instruct。光看名字可能有點複雜,但拆解開來,你會發現它驚人的實力:

  • 這是一個擁有 4800 億(480B)參數的混合專家模型(MoE),其中活躍參數為 350 億(35B),在效能與效率之間取得了絕佳平衡。
  • 它原生支援 256K token 的超長上下文窗口,並可透過外推方法擴展至 1M token。這意味著它可以輕鬆處理整個程式碼庫的複雜任務。
  • 在程式碼生成與智慧體(Agentic)任務方面,它的表現達到了業界頂尖水準,在多項評測中足以媲美強大的閉源模型 Claude Sonnet 4

除了模型本身,團隊還開源了一款名為 Qwen Code 的命令列工具,讓開發者能更順暢地發揮 Qwen3-Coder 的全部潛力。這不僅僅是一個程式碼生成工具,更是一個邁向未來的程式碼智慧體。

不僅是寫程式,更是「智慧體程式設計」的時代

你可能會問,「智慧體程式設計」(Agentic Coding)到底是什麼?

簡單來說,這代表模型不再只是一個被動的程式碼生成器。它更像一個初級的軟體工程師,能夠在多輪互動中進行規劃、使用工具、接收回饋並做出決策。當面對一個複雜的軟體工程問題時,Qwen3-Coder 能夠像人一樣拆解任務、執行指令、修復錯誤,直到完成目標。

從評測數據來看,Qwen3-Coder 在多個關鍵領域都展現了頂尖實力:

  • Agentic Coding (智慧體程式設計): 在 SWE-bench、Aider-Polyglot 等多項評測中,其表現超越了所有開源模型。
  • Agentic Browser-Use (智慧體瀏覽器使用): 在 WebArena 測試中,分數直逼 Claude Sonnet 4。
  • Agentic Tool-Use (智慧體工具使用): 在 BFCL-V3、TAU-Bench 等測試中,同樣名列前茅。

坦白說,這些數據不僅證明了 Qwen3-Coder 在開源社群中的領先地位,更顯示了它有足夠的實力挑戰像 Claude Sonnet 4 和 GPT-4.1 這樣的頂級閉源模型。

強大效能的背後:解密 Qwen3-Coder 的訓練心法

這麼強大的能力是怎麼煉成的?這背後是一套縝密且宏大的訓練策略,分為「預訓練」和「後訓練」兩個階段。

預訓練階段:奠定堅實基礎

在預訓練階段,團隊從三個維度進行了規模化擴展,為模型打下堅實的基礎:

  1. 擴展 Tokens: 模型在 7.5 萬億 (7.5T) 個 token 上進行訓練,其中程式碼相關數據佔比高達 70%。這確保了它在程式碼領域的深度理解,同時也保留了強大的通用和數學能力。
  2. 擴展上下文: 原生支援的 256K 超長上下文,加上 YaRN 技術擴展到 1M,讓模型能夠處理整個程式碼庫(repo-scale)級別的數據,例如分析大型專案或處理 Pull Requests。
  3. 擴展合成數據: 團隊利用了前代模型 Qwen2.5-Coder 來清洗和重寫嘈雜的數據,大幅提升了訓練數據的整體品質。

後訓練階段:從優秀到卓越的精進

如果說預訓練是打好地基,那後訓練就是精雕細琢。

團隊的核心理念是,所有程式碼任務都非常適合透過「執行驅動的大規模強化學習」來優化。他們不再局限於傳統的演算法競賽題目,而是將 Code RL (程式碼強化學習) 擴展到更廣泛、更真實的程式設計場景中。

更關鍵的是,他們引入了長遠規劃強化學習 (Long-Horizon RL 或 Agent RL)。這是為了解決像 SWE-Bench 這類需要多步驟、長鏈條互動的真實世界軟體工程任務。

這裡最大的挑戰在於「環境擴展」。為了讓模型能大規模地學習,團隊藉助阿里雲的基礎設施,搭建了一個能夠同時運行 20,000 個獨立環境的強大系統。這個系統為模型提供了海量的即時回饋,讓它在不斷試錯中學習如何規劃和解決複雜問題。

正是這種不計成本的投入,才讓 Qwen3-Coder 在沒有測試時擴展 (test-time scaling) 的情況下,依然能在 SWE-Bench 這類權威評測中取得開源模型的最佳成績。

如何立即上手?與 Qwen3-Coder 一起寫程式

說了這麼多,該如何實際體驗呢?團隊提供了多種無縫接軌的方式,讓你能立刻開始使用。

首先,請確保你已經安裝了 Node.js (版本 20+)。

1. 使用官方 Qwen Code CLI 工具

這是一個專為 Qwen-Coder 模型打造的命令列工具,你可以透過 npm 快速安裝:

npm i -g @qwen-code/qwen-code

或者,你也可以從原始碼安裝:

git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g

Qwen Code 支援 OpenAI SDK,你只需要設定好環境變數,就能開始呼叫模型了。

2. 整合 Claude Code

如果你習慣使用 Claude Code 的生態,現在也可以將後端模型換成 Qwen3-Coder。

npm install -g @anthropic-ai/claude-code

接著,你有兩種方式進行整合:

  • 選項一:使用代理 API 設定環境變數即可,簡單直接。

  • 選項二:使用路由客製化套件 這種方式更靈活,可以透過 claude-code-router 來管理不同的後端模型。

3. 整合 Cline

你也可以在 Cline 這款工具中設定使用 Qwen3-Coder。只需在設定中選擇「OpenAI Compatible」,並填入從 DashScope 獲取的 API 金鑰和對應的 Base URL 即可。

未來展望:邁向自我進化的程式碼智慧體

Qwen3-Coder 的發布顯然不是終點。團隊表示,他們仍在積極改進 Coding Agent 的性能,目標是讓它能夠處理更複雜、更繁瑣的軟體工程任務,從而將人類開發者從重複性勞動中解放出來。

未來,我們可以期待:

  • 更多尺寸的模型: 團隊將推出更多不同大小的 Qwen3-Coder 模型,以在性能和部署成本之間提供更多選擇。
  • 自我進化的可能性: 最令人興奮的是,團隊正在積極探索 Coding Agent 是否能實現「自我改進」。這是一個極具挑戰性但又充滿想像空間的方向,或許預示著真正自主的 AI 開發夥伴即將到來。

總而言之,Qwen3-Coder 的誕生,不僅是開源程式碼模型領域的一次重大突破,也為我們揭示了 AI 輔助軟體開發的下一個篇章。一個更智慧、更自主的程式設計新時代,正悄然來臨。

分享至:

© 2025 Communeify. All rights reserved.