Qwen3-Coder:挑戰 Claude Sonnet 4,阿里通義千問釋出最強程式碼模型
阿里雲通義千問團隊正式發布 Qwen3-Coder,這款擁有 4800 億參數的 MoE 模型在程式碼和 Agentic 任務上表現卓越,原生支援 256K 超長上下文,性能直逼 Claude Sonnet 4。本文將深入解析其技術細節、訓練過程與實際應用。
程式碼大模型領域的重磅玩家登場
就在最近,阿里雲通義千問團隊投下了一枚震撼彈,正式宣布推出他們迄今為止最強大的「智慧體程式設計模型」 (Agentic Code Model) — Qwen3-Coder。
這次發布的明星產品是 Qwen3-Coder-480B-A35B-Instruct。光看名字可能有點複雜,但拆解開來,你會發現它驚人的實力:
- 這是一個擁有 4800 億(480B)參數的混合專家模型(MoE),其中活躍參數為 350 億(35B),在效能與效率之間取得了絕佳平衡。
- 它原生支援 256K token 的超長上下文窗口,並可透過外推方法擴展至 1M token。這意味著它可以輕鬆處理整個程式碼庫的複雜任務。
- 在程式碼生成與智慧體(Agentic)任務方面,它的表現達到了業界頂尖水準,在多項評測中足以媲美強大的閉源模型 Claude Sonnet 4。
除了模型本身,團隊還開源了一款名為 Qwen Code 的命令列工具,讓開發者能更順暢地發揮 Qwen3-Coder 的全部潛力。這不僅僅是一個程式碼生成工具,更是一個邁向未來的程式碼智慧體。
不僅是寫程式,更是「智慧體程式設計」的時代
你可能會問,「智慧體程式設計」(Agentic Coding)到底是什麼?
簡單來說,這代表模型不再只是一個被動的程式碼生成器。它更像一個初級的軟體工程師,能夠在多輪互動中進行規劃、使用工具、接收回饋並做出決策。當面對一個複雜的軟體工程問題時,Qwen3-Coder 能夠像人一樣拆解任務、執行指令、修復錯誤,直到完成目標。
從評測數據來看,Qwen3-Coder 在多個關鍵領域都展現了頂尖實力:
- Agentic Coding (智慧體程式設計): 在 SWE-bench、Aider-Polyglot 等多項評測中,其表現超越了所有開源模型。
- Agentic Browser-Use (智慧體瀏覽器使用): 在 WebArena 測試中,分數直逼 Claude Sonnet 4。
- Agentic Tool-Use (智慧體工具使用): 在 BFCL-V3、TAU-Bench 等測試中,同樣名列前茅。
坦白說,這些數據不僅證明了 Qwen3-Coder 在開源社群中的領先地位,更顯示了它有足夠的實力挑戰像 Claude Sonnet 4 和 GPT-4.1 這樣的頂級閉源模型。
強大效能的背後:解密 Qwen3-Coder 的訓練心法
這麼強大的能力是怎麼煉成的?這背後是一套縝密且宏大的訓練策略,分為「預訓練」和「後訓練」兩個階段。
預訓練階段:奠定堅實基礎
在預訓練階段,團隊從三個維度進行了規模化擴展,為模型打下堅實的基礎:
- 擴展 Tokens: 模型在 7.5 萬億 (7.5T) 個 token 上進行訓練,其中程式碼相關數據佔比高達 70%。這確保了它在程式碼領域的深度理解,同時也保留了強大的通用和數學能力。
- 擴展上下文: 原生支援的 256K 超長上下文,加上 YaRN 技術擴展到 1M,讓模型能夠處理整個程式碼庫(repo-scale)級別的數據,例如分析大型專案或處理 Pull Requests。
- 擴展合成數據: 團隊利用了前代模型 Qwen2.5-Coder 來清洗和重寫嘈雜的數據,大幅提升了訓練數據的整體品質。
後訓練階段:從優秀到卓越的精進
如果說預訓練是打好地基,那後訓練就是精雕細琢。
團隊的核心理念是,所有程式碼任務都非常適合透過「執行驅動的大規模強化學習」來優化。他們不再局限於傳統的演算法競賽題目,而是將 Code RL (程式碼強化學習) 擴展到更廣泛、更真實的程式設計場景中。
更關鍵的是,他們引入了長遠規劃強化學習 (Long-Horizon RL 或 Agent RL)。這是為了解決像 SWE-Bench 這類需要多步驟、長鏈條互動的真實世界軟體工程任務。
這裡最大的挑戰在於「環境擴展」。為了讓模型能大規模地學習,團隊藉助阿里雲的基礎設施,搭建了一個能夠同時運行 20,000 個獨立環境的強大系統。這個系統為模型提供了海量的即時回饋,讓它在不斷試錯中學習如何規劃和解決複雜問題。
正是這種不計成本的投入,才讓 Qwen3-Coder 在沒有測試時擴展 (test-time scaling) 的情況下,依然能在 SWE-Bench 這類權威評測中取得開源模型的最佳成績。
如何立即上手?與 Qwen3-Coder 一起寫程式
說了這麼多,該如何實際體驗呢?團隊提供了多種無縫接軌的方式,讓你能立刻開始使用。
首先,請確保你已經安裝了 Node.js (版本 20+)。
1. 使用官方 Qwen Code CLI 工具
這是一個專為 Qwen-Coder 模型打造的命令列工具,你可以透過 npm
快速安裝:
npm i -g @qwen-code/qwen-code
或者,你也可以從原始碼安裝:
git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g
Qwen Code
支援 OpenAI SDK,你只需要設定好環境變數,就能開始呼叫模型了。
2. 整合 Claude Code
如果你習慣使用 Claude Code 的生態,現在也可以將後端模型換成 Qwen3-Coder。
npm install -g @anthropic-ai/claude-code
接著,你有兩種方式進行整合:
選項一:使用代理 API 設定環境變數即可,簡單直接。
選項二:使用路由客製化套件 這種方式更靈活,可以透過
claude-code-router
來管理不同的後端模型。
3. 整合 Cline
你也可以在 Cline 這款工具中設定使用 Qwen3-Coder。只需在設定中選擇「OpenAI Compatible」,並填入從 DashScope 獲取的 API 金鑰和對應的 Base URL 即可。
未來展望:邁向自我進化的程式碼智慧體
Qwen3-Coder 的發布顯然不是終點。團隊表示,他們仍在積極改進 Coding Agent 的性能,目標是讓它能夠處理更複雜、更繁瑣的軟體工程任務,從而將人類開發者從重複性勞動中解放出來。
未來,我們可以期待:
- 更多尺寸的模型: 團隊將推出更多不同大小的 Qwen3-Coder 模型,以在性能和部署成本之間提供更多選擇。
- 自我進化的可能性: 最令人興奮的是,團隊正在積極探索 Coding Agent 是否能實現「自我改進」。這是一個極具挑戰性但又充滿想像空間的方向,或許預示著真正自主的 AI 開發夥伴即將到來。
總而言之,Qwen3-Coder 的誕生,不僅是開源程式碼模型領域的一次重大突破,也為我們揭示了 AI 輔助軟體開發的下一個篇章。一個更智慧、更自主的程式設計新時代,正悄然來臨。