OpenAI 震撼发布 gpt-oss-120b 与 gpt-oss-20b：开源 AI 的新里程碑？深入解析其架构、性能与安全挑战

发布于: 2025-08-06 • 更新于: 2025-08-06 • 2 分钟阅读

OpenAI 正式开源 gpt-oss-120b 及 gpt-oss-20b 两款强大推理模型。本文将深入探讨其创新的 MoE 架构、与 GPT-4o 等模型的性能比较、多语言能力，以及 OpenAI 在开源模型安全方面的考量与对策。

就在昨天 (2025 年 8 月 5 日)，OpenAI 投下了一颗震撼弹，宣布释出两款全新的开源权重推理模型：gpt-oss-120b 和 gpt-oss-20b。这不仅是 OpenAI 对开源社区的一次重要回馈，更可能预示着 AI 开发典范的又一次转变。

这两款模型采用了对开发者友善的 Apache 2.0 授权，专为需要强大指令遵循、工具使用（如网络搜索和 Python 代码执行）以及复杂推理能力的“智能体工作流”(agentic workflows) 而设计。

然而，开源从来都是一体两面。它在赋予开发者极大自由度的同时，也带来了潜在的风险。一旦模型被释出，有心人士就可能对其进行微调，绕过安全护栏。那么，OpenAI 这次是如何在创新与安全之间取得平衡的呢？让我们一起深入探讨这些模型的里里外外。

不只是更大的模型：深入了解 MoE 架构与量化技术

首先，我们来看看这两款模型的硬件规格。gpt-oss 系列并非传统的巨无霸模型，而是采用了更聪明、更高效的“专家混合”(Mixture-of-Experts, MoE) 架构。

你可以把 MoE 想象成一个顶尖的顾问团队。传统模型就像一位全才顾问，试图解决所有问题；而 MoE 模型则拥有一群各有所长的专家，每次只会启动最相关的几位专家来处理任务。这种设计大幅提高了模型的效率。

gpt-oss-120b：拥有 1168 亿个总参数，但在每次推理时，每个 token 只需动用约 51 亿个“活性”参数。
gpt-oss-20b：拥有 209 亿个总参数，活性参数则为 36 亿。

更重要的是，OpenAI 采用了 MXFP4 格式进行权重量化。这项技术大幅压缩了模型的内存占用，让原本遥不可及的巨型模型变得亲民许多。现在，120b 模型可以在单张 80GB 的 GPU 上运行，而 20b 模型甚至在 16GB 内存的系统上也能顺畅工作。这无疑为广大独立开发者和研究人员开启了新的大门。

性能评测：gpt-oss 的实力到底如何？

说了这么多，它们的实际表现又如何呢？OpenAI 在多个权威基准测试中，将 gpt-oss 与自家其他模型（包括 o3, o3-mini, o4-mini）进行了比较。

挑战顶级模型的推理与知识能力

从官方公布的数据来看，gpt-oss-120b 的表现相当亮眼：

在 AIME（数学竞赛） 和 MMLU（大学程度多任务理解） 等测试中，gpt-oss-120b 的准确率全面超越了 o3-mini，并且紧追 o4-mini。
即使是体积小了 6 倍的 gpt-oss-20b，其表现也出奇地具有竞争力，在某些任务上甚至能与 o3-mini 并驾齐驱。

医疗领域的黑马

最令人惊讶的，莫过于它在医疗领域的表现。在 HealthBench（模拟真实医病对话） 的评测中，gpt-oss-120b 的性能不仅大幅超越了 GPT-4o (gpt-4o) 和 o4-mini，甚至几乎与顶尖的闭源模型 o3 打平。

这项成果意义重大。对于全球许多受限于隐私和成本的医疗环境来说，一个强大且可本地部署的开源 AI 模型，可能为智慧医疗带来革命性的改变。

强大的多语言与代码能力

在 MMMLU（多语言基准测试） 中，gpt-oss-120b 在 14 种语言上展现了卓越的能力，平均表现非常接近 o4-mini 的高推理模式。而在 Codeforces（代码竞赛） 和 SWE-Bench（软件工程） 等测试中，其表现同样出色，证明了它在代码生成和理解方面的强大实力。

独特功能：Harmony Chat 格式与智能体工具

gpt-oss 的强大之处不仅在于性能，更在于其为“智能体”应用量身打造的设计。

Harmony Chat 格式

这是一种自定义的聊天格式，通过特殊的 token 来划分消息边界，并明确定义了不同角色的指令层级：系统 > 开发者 > 用户 > 助理 > 工具。这种层级结构让开发者能更精准地控制模型的行为，防止用户通过恶意提问来覆写系统指令。

此外，该格式还引入了“频道”(channels) 的概念，如 analysis (用于 CoT 思考链)、commentary (用于工具呼叫) 和 final (用于最终呈现给用户的答案)，让模型的思考过程更加透明可控。

可变推理与内建工具

开发者可以通过在系统提示中加入 Reasoning: low/medium/high 等关键字，来动态调整模型的“思考深度”。这让开发者可以在效能与延迟成本之间找到最佳平衡点。

模型也内建了多种智能体工具：

浏览工具：允许模型搜索和开启网页，获取其知识库以外的即时信息。
Python 工具：让模型能在一个安全的 Jupyter Notebook 环境中执行代码。
自定义函数：开发者可以像使用 OpenAI API 一样，定义自己的工具函数供模型调用。

安全性：开源浪潮下的深思熟虑

谈到开源，安全永远是绕不开的话题。OpenAI 显然对此进行了深入的思考和准备。他们提出了一个尖锐的问题：恶意行为者能否将 gpt-oss-120b 微调成一个具有高度危险能力的工具？

为了回答这个问题，OpenAI 进行了严格的“对抗性微调”测试：

模拟攻击：他们模拟了一个技术高超、拥有充足运算资源的攻击者，试图将模型微调到在“生化”、“网络安全”和“AI 自我改进”等高风险领域达到“高能力”阈值。
测试结果：结论是令人松一口气的。即使利用 OpenAI 领先的训练技术栈进行了强化的微调，gpt-oss-120b 也未能达到高风险能力的门槛。
与现有开源模型的比较：此外，评估发现，释出 gpt-oss-120b 并不会显著提升现有开源模型在生物安全等领域的能力上限，因为目前市面上已经有其他开源模型的性能与之相当接近。

这表明，虽然风险依然存在，但 OpenAI 已经采取了负责任的步骤来评估和沟通这些风险。

现存挑战与开发者须知

当然，gpt-oss 也不是完美的。官方报告坦诚地指出了几个需要注意的挑战：

指令遵循：虽然模型对已知的“越狱”(Jailbreaks) 攻击有不错的防御力，但在严格遵循“系统提示”优先于“用户提示”的“指令层级”方面，其表现不如 o4-mini。这意味着开发者需要自行设计更周全的防护机制。
幻觉思考链 (CoT)：OpenAI 决定不对模型的思考链进行内容限制。这样做的好处是方便学术界研究 CoT 的可监控性，但同时也意味着 开发者绝不能直接将模型的原始思考过程展示给终端用户，必须先进行过滤或摘要。
事实幻觉：与所有大型语言模型一样，gpt-oss 也会产生事实性错误。虽然内建的浏览工具可以缓解这个问题，但在不使用工具的情况下，其准确性仍低于更大的闭源模型。

结论

gpt-oss-120b 和 gpt-oss-20b 的释出，无疑是开源 AI 社区的一大福音。它们不仅性能强大、效率出众，更重要的是，它们在设计之初就充分考虑了智能体应用的需求，并透过量化技术降低了使用门槛。

OpenAI 在安全方面的审慎评估也为其他公司树立了良好的榜样。然而，皮球现在传到了开发者社区的手中。如何负责任地使用这些强大的工具，如何在创新的同时确保安全，将是我们共同面临的课题。

这是一个令人兴奋的开始。我们可以期待，在 gpt-oss 的推动下，一个更加开放、多元且充满活力的 AI 生态系统将加速到来。

前往試用

https://gpt-oss.com/

常见问题解答 (FAQ)

Q1：我需要什么样的硬件才能运行这些模型？ A1： 由于采用了 MXFP4 量化技术，硬件门槛大幅降低。gpt-oss-120b 模型可以在单张 80GB VRAM 的 GPU（如 NVIDIA H100）上运行。而 gpt-oss-20b 模型的要求更低，可以在拥有 16GB 内存的系统上运行，这使得更多开发者能够接触和使用。

Q2：这些模型与 GPT-4o 相比如何？ A2： 从官方数据来看，gpt-oss-120b 在多项基准测试中的表现与 o4-mini (一个与 GPT-4o 同等级但可能规模较小的模型) 非常接近，甚至在特定领域（如医疗对话）超越了它。然而，它并非设计来完全取代像 GPT-4o 这样的顶尖闭源模型，后者在某些方面的综合能力可能依然更强。gpt-oss 的核心优势在于其开放性、可定制化以及为智能体工作流设计的特定功能。

Q3：使用这些开源模型是否存在安全风险？ A3： 是的，所有开源模型都存在被滥用的风险。但 OpenAI 已经进行了主动的风险评估，他们模拟了恶意攻击者对模型进行微调，结论是即便如此，模型也难以达到生物或网络安全领域的“高危险”能力。尽管如此，OpenAI 强调，维护安全的责任现在由整个开发者社区共同承担，开发者在使用时必须实施自己的安全措施。

Q4：什么是“Harmony Chat 格式”，它有什么特别之处？ A4： Harmony Chat 格式是 gpt-oss 使用的一种特殊聊天结构。它最大的特点是定义了严格的指令层级（系统 > 开发者 > 用户 > 助理 > 工具），这有助于防止用户通过恶意提问来操纵或覆写系统设定的安全护栏。此外，它还通过“频道”来区分模型的思考过程和最终答案，增加了透明度和可控性，这对于开发复杂的智能体应用至关重要。

分享到:

DMflow.chat

DMflow.chat：您的智能对话伙伴，提升客户互动体验。

Learn More

智谱 AI 再出奇招！GLM-4.5V 横空出世，问鼎开源最强视觉模型

AI 圈又迎来重磅消息！智谱 AI 正式发布基于 MoE 架构的新一代视觉推理模型 GLM-4.5V。它不仅在多项基准测试中称霸，更以开源的姿态向所有开发者开 …

August 12, 2025

Qwen3-4B-Thinking-2507 登场：4B 模型也能拥有 256K 超长上下文与顶尖推理能力？

AI 领域再次迎来震撼弹！全新发布的 Qwen3-4B-Thinking-2507 模型，不仅在推理能力上实现巨大飞跃，更在一个仅 4B 参数的轻量级模型中， …

August 7, 2025

腾讯混元再出招！开源四款轻量级 AI 模型，让笔电手机都能跑的智慧大脑

腾讯混元团队再次震撼 AI 社群，正式开源四款从 0.5B 到 7B 的小尺寸模型。这些模型专为消费级硬件设计，具备惊人的 256k …

August 4, 2025

Z.ai 发布新一代旗舰模型 GLM-4.5：性能全面超越，剑指 AI 代理新时代

AI 领域的黑马 Z.ai 再掀波澜！全新发布的 GLM-4.5 和 GLM-4.5-Air 模型不仅在参数规模上令人瞩目，更以创新的「混合推理模式」和在多项 …

July 30, 2025

Qwen3-Coder：挑战 Claude Sonnet 4，阿里通义千问释出最强代码模型

阿里云通义千问团队正式发布 Qwen3-Coder，这款拥有 4800 亿参数的 MoE 模型在代码和 Agentic 任务上表现卓越，原生支持 256K 超 …

July 23, 2025

Mistral Large 2：突破性的人工智能语言模型

Mistral Large 2 是一款新一代的大型语言模型，具有卓越的成本效益、速度和性能。它支持多种语言和编程语言，并在多个基准测试中展现出优异的表现。本文将 …

July 25, 2024