AI 領域的黑馬 Z.ai 再掀波瀾!全新發布的 GLM-4.5 和 GLM-4.5-Air 模型不僅在參數規模上令人矚目,更以創新的「混合推理模式」和在多項權威基準測試中的驚人表現,宣告了其在複雜 AI 代理(Agentic AI)應用領域的強大野心。
人工智慧的競賽從未停歇,就在大家還在討論各大巨頭的模型時,來自 Z.ai 的研發團隊投下了一顆震撼彈。他們正式推出了 GLM 系列的兩位新成員:GLM-4.5 與 GLM-4.5-Air,這不僅僅是一次常規的更新,更像是一次技術躍遷的宣言。
這兩個模型從設計之初,目標就非常明確:將頂尖的推理、程式碼生成和 AI 代理能力整合到單一模型中,以應對日益複雜的應用場景。在這個 AI 代理應用快速崛起的時代,這一步棋顯得格外重要。
雙雄登場:不僅僅是參數的堆疊
當我們談論一個新模型時,參數規模總是一個繞不開的話題。但 GLM-4.5 家族告訴我們,聰明的架構比單純的數字更重要。
- GLM-4.5: 作為家族中的頂級旗艦,它擁有高達 3550 億的總參數和 320 億的活躍參數。這意味著它擁有極其深厚的知識儲備和處理複雜問題的能力。
- GLM-4.5-Air: 這是一個更輕量、更高效的版本,擁有 1060 億總參數和 120 億活躍參數。它的存在,是為了在性能和效率之間找到完美的平衡點,適合更多元的應用場景。
你可能會問,什麼是「活躍參數」?這就像一個人的大腦,雖然儲存了海量資訊,但在思考特定問題時,只會調動最相關的部分。這種 Mixture-of-Experts (MoE) 架構讓模型在保持強大能力的同時,運算效率更高,反應也更迅速。
思考與不思考之間:混合推理模式的革新
這或許是 GLM-4.5 系列最令人興奮的創新點。過去,我們常常需要在模型的「思考深度」和「反應速度」之間做取捨。但 GLM-4.5 引入了混合推理模式,讓模型可以像人一樣,根據問題的難度,自動切換工作模式。
- 思考模式 (Thinking mode): 當遇到需要多步驟推理、規劃或使用外部工具(例如搜尋資料、執行程式碼)的複雜任務時,模型會進入此模式。它會「停下來想一想」,制定策略,確保給出高品質、有深度的答案。
- 非思考模式 (Non-thinking mode): 對於簡單、直接的問答,模型則會切換到這個模式,提供即時、快速的回應,毫不拖泥帶水。
這種設計的好處顯而易見:它兼顧了深度與速度,確保使用者在任何場景下都能獲得最佳體驗。
實力見真章:橫掃各大基準測試
說了這麼多,實際表現如何?數據永遠是最有力的證明。從官方公布的基準測試圖表來看,GLM-4.5 雙雄的表現只能用「驚人」來形容。
我們來逐一分析:
- TAU-Bench (零售業場景): 在這個模擬真實零售業對話的測試中,GLM-4.5 (79.7分) 和 GLM-4.5-Air (77.9分) 的表現非常亮眼,與業界頂尖模型並駕齊驅,大幅領先其他知名模型。
- TAU-Bench (航空業場景): 這個場景同樣考驗模型的專業領域對話能力。有趣的是,更輕量的 GLM-4.5-Air (60.8分) 在此項目中甚至以微弱優勢超過了它的「大哥」GLM-4.5 (60.4分),雙雙佔據了榜首位置,展示了其優異的效率和性能。
- BFCL-v3 (多輪對話): 這項測試是真正的重頭戲,它專門評估模型在長時間、多輪次對話中維持上下文理解和邏輯一致性的能力——這正是 AI 代理的核心。在這個項目上,GLM-4.5 (64.3分) 和 GLM-4.5-Air (61.9分) 取得了壓倒性的勝利,將其他所有對手遠遠甩在身後。這強烈地證明了它們在執行複雜代理任務上的巨大潛力。
立即體驗與開源:擁抱社群的力量
Z.ai 團隊深知,一個偉大的模型需要一個活躍的社群。因此,他們提供了多種方式讓大家體驗和使用 GLM-4.5 系列:
- 線上體驗: 你可以直接訪問 Z.ai 官網或 BigModel.cn 平台,親身感受新模型的強大之處。
- 開源權重: 對於開發者和研究人員來說,最大的好消息莫過於此。GLM-4.5 和 GLM-4.5-Air 的模型權重已經在 Hugging Face 和 ModelScope 上開放,任何人都可以下載並在自己的專案中部署。
這種開放的態度,無疑將極大加速 GLM-4.5 生態的發展,催生出更多富有創意的應用。
常見問題 (FAQ)
Q1: GLM-4.5 和 GLM-4.5-Air 之間我該如何選擇?
A: 這取決於你的需求。如果你追求最強大的性能,需要處理極其複雜的推理任務,那麼擁有更多參數的 GLM-4.5 是你的首選。如果你更看重效率和反應速度,或者需要在資源有限的環境下部署,那麼 GLM-4.5-Air 將提供無與倫比的性價比。
Q2: 「混合推理模式」對普通使用者來說意味著什麼?
A: 簡單來說,你不需要再擔心向 AI 提問時,它會「想太久」或「想太淺」。模型會自動判斷你的問題難度。問簡單的問題,它會秒回;問複雜的問題,它會像專家一樣深入思考後再給你可靠的答案,體驗非常流暢。
Q3: 我是一個開發者,可以在哪裡獲得這些模型?
A: 你可以透過多個管道取得模型。最直接的方式是前往 Hugging Face 的 Z.ai 頁面,那裡有 GLM-4.5 和 GLM-4.5-Air 的完整模型權重可供下載。同時,你也可以在 Z.ai 和 BigModel.cn 平台上透過 API 進行呼叫。


