Qwen3-Coder：挑戰 Claude Sonnet 4，阿里通義千問釋出最強程式碼模型

發佈於: 2025-07-23 • 更新於: 2025-07-23 • 2 分鐘閱讀

阿里雲通義千問團隊正式發布 Qwen3-Coder，這款擁有 4800 億參數的 MoE 模型在程式碼和 Agentic 任務上表現卓越，原生支援 256K 超長上下文，性能直逼 Claude Sonnet 4。本文將深入解析其技術細節、訓練過程與實際應用。

程式碼大模型領域的重磅玩家登場

就在最近，阿里雲通義千問團隊投下了一枚震撼彈，正式宣布推出他們迄今為止最強大的「智慧體程式設計模型」 (Agentic Code Model) — Qwen3-Coder。

這次發布的明星產品是 Qwen3-Coder-480B-A35B-Instruct。光看名字可能有點複雜，但拆解開來，你會發現它驚人的實力：

除了模型本身，團隊還開源了一款名為 Qwen Code 的命令列工具，讓開發者能更順暢地發揮 Qwen3-Coder 的全部潛力。這不僅僅是一個程式碼生成工具，更是一個邁向未來的程式碼智慧體。

你可能會問，「智慧體程式設計」（Agentic Coding）到底是什麼？

簡單來說，這代表模型不再只是一個被動的程式碼生成器。它更像一個初級的軟體工程師，能夠在多輪互動中進行規劃、使用工具、接收回饋並做出決策。當面對一個複雜的軟體工程問題時，Qwen3-Coder 能夠像人一樣拆解任務、執行指令、修復錯誤，直到完成目標。

從評測數據來看，Qwen3-Coder 在多個關鍵領域都展現了頂尖實力：

坦白說，這些數據不僅證明了 Qwen3-Coder 在開源社群中的領先地位，更顯示了它有足夠的實力挑戰像 Claude Sonnet 4 和 GPT-4.1 這樣的頂級閉源模型。

這麼強大的能力是怎麼煉成的？這背後是一套縝密且宏大的訓練策略，分為「預訓練」和「後訓練」兩個階段。

在預訓練階段，團隊從三個維度進行了規模化擴展，為模型打下堅實的基礎：

擴展 Tokens： 模型在 7.5 萬億 (7.5T) 個 token 上進行訓練，其中程式碼相關數據佔比高達 70%。這確保了它在程式碼領域的深度理解，同時也保留了強大的通用和數學能力。
擴展上下文： 原生支援的 256K 超長上下文，加上 YaRN 技術擴展到 1M，讓模型能夠處理整個程式碼庫（repo-scale）級別的數據，例如分析大型專案或處理 Pull Requests。
擴展合成數據： 團隊利用了前代模型 Qwen2.5-Coder 來清洗和重寫嘈雜的數據，大幅提升了訓練數據的整體品質。

如果說預訓練是打好地基，那後訓練就是精雕細琢。

團隊的核心理念是，所有程式碼任務都非常適合透過「執行驅動的大規模強化學習」來優化。他們不再局限於傳統的演算法競賽題目，而是將 Code RL (程式碼強化學習) 擴展到更廣泛、更真實的程式設計場景中。

更關鍵的是，他們引入了長遠規劃強化學習 (Long-Horizon RL 或 Agent RL)。這是為了解決像 SWE-Bench 這類需要多步驟、長鏈條互動的真實世界軟體工程任務。

這裡最大的挑戰在於「環境擴展」。為了讓模型能大規模地學習，團隊藉助阿里雲的基礎設施，搭建了一個能夠同時運行 20,000 個獨立環境的強大系統。這個系統為模型提供了海量的即時回饋，讓它在不斷試錯中學習如何規劃和解決複雜問題。

正是這種不計成本的投入，才讓 Qwen3-Coder 在沒有測試時擴展 (test-time scaling) 的情況下，依然能在 SWE-Bench 這類權威評測中取得開源模型的最佳成績。

說了這麼多，該如何實際體驗呢？團隊提供了多種無縫接軌的方式，讓你能立刻開始使用。

首先，請確保你已經安裝了 Node.js (版本 20+)。

這是一個專為 Qwen-Coder 模型打造的命令列工具，你可以透過 npm 快速安裝：

npm i -g @qwen-code/qwen-code

或者，你也可以從原始碼安裝：

git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g

Qwen Code 支援 OpenAI SDK，你只需要設定好環境變數，就能開始呼叫模型了。

如果你習慣使用 Claude Code 的生態，現在也可以將後端模型換成 Qwen3-Coder。

npm install -g @anthropic-ai/claude-code

接著，你有兩種方式進行整合：

你也可以在 Cline 這款工具中設定使用 Qwen3-Coder。只需在設定中選擇「OpenAI Compatible」，並填入從 DashScope 獲取的 API 金鑰和對應的 Base URL 即可。

Qwen3-Coder 的發布顯然不是終點。團隊表示，他們仍在積極改進 Coding Agent 的性能，目標是讓它能夠處理更複雜、更繁瑣的軟體工程任務，從而將人類開發者從重複性勞動中解放出來。

未來，我們可以期待：

更多尺寸的模型： 團隊將推出更多不同大小的 Qwen3-Coder 模型，以在性能和部署成本之間提供更多選擇。
自我進化的可能性： 最令人興奮的是，團隊正在積極探索 Coding Agent 是否能實現「自我改進」。這是一個極具挑戰性但又充滿想像空間的方向，或許預示著真正自主的 AI 開發夥伴即將到來。

總而言之，Qwen3-Coder 的誕生，不僅是開源程式碼模型領域的一次重大突破，也為我們揭示了 AI 輔助軟體開發的下一個篇章。一個更智慧、更自主的程式設計新時代，正悄然來臨。