tool

Z.ai 发布新一代旗舰模型 GLM-4.5:性能全面超越,剑指 AI 代理新时代

July 30, 2025
Updated Jul 30
1 min read

AI 领域的黑马 Z.ai 再掀波澜!全新发布的 GLM-4.5 和 GLM-4.5-Air 模型不仅在参数规模上令人瞩目,更以创新的「混合推理模式」和在多项权威基准测试中的惊人表现,宣告了其在复杂 AI 代理(Agentic AI)应用领域的强大野心。


人工智能的竞赛从未停歇,就在大家还在讨论各大巨头的模型时,来自 Z.ai 的研发团队投下了一颗震撼弹。他们正式推出了 GLM 系列的两位新成员:GLM-4.5GLM-4.5-Air,这不仅仅是一次常规的更新,更像是一次技术跃迁的宣言。

这两个模型从设计之初,目标就非常明确:将顶尖的推理、代码生成和 AI 代理能力整合到单一模型中,以应对日益复杂的应用场景。在这个 AI 代理应用快速崛起的时代,这一步棋显得格外重要。

双雄登场:不仅仅是参数的堆叠

当我们讨论一个新模型时,参数规模总是一个绕不开的话题。但 GLM-4.5 家族告诉我们,聪明的架构比单纯的数字更重要。

  • GLM-4.5: 作为家族中的顶级旗舰,它拥有高达 3550 亿的总参数和 320 亿的活跃参数。这意味着它拥有极其深厚的知识储备和处理复杂问题的能力。
  • GLM-4.5-Air: 这是一个更轻量、更高效的版本,拥有 1060 亿总参数和 120 亿活跃参数。它的存在,是为了在性能和效率之间找到完美的平衡点,适合更多元的应用场景。

你可能会问,什么是「活跃参数」?这就像一个人的大脑,虽然储存了海量资讯,但在思考特定问题时,只会调动最相关的部分。这种 Mixture-of-Experts (MoE) 架构让模型在保持强大能力的同时,运算效率更高,反应也更迅速。

思考与不思考之间:混合推理模式的革新

这或许是 GLM-4.5 系列最令人兴奋的创新点。过去,我们常常需要在模型的「思考深度」和「反应速度」之间做取舍。但 GLM-4.5 引入了混合推理模式,让模型可以像人一样,根据问题的难度,自动切换工作模式。

  • 思考模式 (Thinking mode): 当遇到需要多步骤推理、规划或使用外部工具(例如搜寻资料、执行代码)的复杂任务时,模型会进入此模式。它会「停下来想一想」,制定策略,确保给出高品质、有深度的答案。
  • 非思考模式 (Non-thinking mode): 对于简单、直接的问答,模型则会切换到这个模式,提供即时、快速的回应,毫不拖泥带水。

这种设计的好处显而易见:它兼顾了深度与速度,确保使用者在任何场景下都能获得最佳体验。

实力见真章:横扫各大基准测试

说了这么多,实际表现如何?数据永远是最有力的证明。从官方公布的基准测试图表来看,GLM-4.5 双雄的表现只能用「惊人」来形容。

我们来逐一分析:

  • TAU-Bench (零售业场景): 在这个模拟真实零售业对话的测试中,GLM-4.5 (79.7分) 和 GLM-4.5-Air (77.9分) 的表现非常亮眼,与业界顶尖模型并驾齐驱,大幅领先其他知名模型。
  • TAU-Bench (航空业场景): 这个场景同样考验模型的专业领域对话能力。有趣的是,更轻量的 GLM-4.5-Air (60.8分) 在此项目中甚至以微弱优势超过了它的「大哥」GLM-4.5 (60.4分),双双占据了榜首位置,展示了其优异的效率和性能。
  • BFCL-v3 (多轮对话): 这项测试是真正的重头戏,它专门评估模型在长时间、多轮次对话中维持上下文理解和逻辑一致性的能力——这正是 AI 代理的核心。在这个项目上,GLM-4.5 (64.3分) 和 GLM-4.5-Air (61.9分) 取得了压倒性的胜利,将其他所有对手远远甩在身后。这强烈地证明了它们在执行复杂代理任务上的巨大潜力。

立即体验与开源:拥抱社群的力量

Z.ai 团队深知,一个伟大的模型需要一个活跃的社群。因此,他们提供了多种方式让大家体验和使用 GLM-4.5 系列:

  • 线上体验: 你可以直接访问 Z.ai 官网或 BigModel.cn 平台,亲身感受新模型的强大之处。
  • 开源权重: 对于开发者和研究人员来说,最大的好消息莫过于此。GLM-4.5 和 GLM-4.5-Air 的模型权重已经在 Hugging Face 和 ModelScope 上开放,任何人都可以下载并在自己的专案中部署。

这种开放的态度,无疑将极大加速 GLM-4.5 生态的发展,催生出更多富有创意的应用。


常见问题 (FAQ)

Q1: GLM-4.5 和 GLM-4.5-Air 之间我该如何选择?

A: 这取决于你的需求。如果你追求最强大的性能,需要处理极其复杂的推理任务,那么拥有更多参数的 GLM-4.5 是你的首选。如果你更看重效率和反应速度,或者需要在资源有限的环境下部署,那么 GLM-4.5-Air 将提供无与伦比的性价比。

Q2: 「混合推理模式」对普通使用者来说意味着什么?

A: 简单来说,你不需要再担心向 AI 提问时,它会「想太久」或「想太浅」。模型会自动判断你的问题难度。问简单的问题,它会秒回;问复杂的问题,它会像专家一样深入思考后再给你可靠的答案,体验非常流畅。

Q3: 我是一个开发者,可以在哪里获得这些模型?

A: 你可以透过多个管道取得模型。最直接的方式是前往 Hugging Face 的 Z.ai 页面,那里有 GLM-4.5 和 GLM-4.5-Air 的完整模型权重可供下载。同时,你也可以在 Z.ai 和 BigModel.cn 平台上透过 API 进行呼叫。

分享到:
Featured Partners

© 2026 Communeify. All rights reserved.