Google Gemini 再进化：全新 2.5 Flash & Flash-Lite 登场，更快、更省、更聪明

Google 推出 Gemini 2.5 Flash 与 Flash-Lite 的最新预览版本，不仅在指令遵循、多模态能力上大幅提升，更显著降低了成本与延迟。此次更新旨在让开发者事半功倍，而全新的 -latest 别名则能简化开发流程。

在追求更强大、更高效 AI 模型的道路上，Google 持续迈进。该公司宣布推出 Gemini 2.5 Flash 和 2.5 Flash-Lite 的最新更新版本，目前已可在 Google AI Studio 和 Vertex AI 上进行体验。此次更新的核心目标明确：在持续提升输出品质的同时，大幅改善模型的运作效率。

简单来说，此举旨在让 AI 不仅更聪明，反应也更快、成本更低。

从下方的图表数据可以清楚看到，新的预览模型在智慧程度（Artificial Analysis Intelligence Index）和端到端回应时间（End-to-end response time）之间取得了绝佳的平衡，相较于目前的稳定版本，效能提升显著。

表 1：智慧 vs. 端到端回应时间

模型版本	智慧指数 (越高越好)	端到端回应时间 (秒，越低越好)
Gemini 2.5 Flash-Lite STABLE (No Thinking)	~30	~2.5
Gemini 2.5 Flash STABLE (No Thinking)	~40	~3.5
Gemini 2.5 Flash-Lite 09-2025 (No Thinking)	~47	~5.0
Gemini 2.5 Flash 09-2025 (No Thinking)	~42.5	~2.0
Gemini 2.5 Flash-Lite STABLE	~40	~7.5
Gemini 2.5 Flash STABLE	~50	~15.5
Gemini 2.5 Flash 09-2025	~53	~10.0

表 2：输出 Token 效率

模型版本	输出 Tokens
Gemini 2.5 Flash (09-2025)	71M
Gemini 2.5 Flash STABLE	93M
Gemini 2.5 Flash-Lite (09-2025)	70M
Gemini 2.5 Flash-Lite STABLE	140M

Flash-Lite：更精准、更简洁，且具备更强的多媒体能力

最新的 Gemini 2.5 Flash-Lite 版本进行了一次全面升级，主要围绕着三个开发者最关心的主题进行了优化：

更精准的指令遵循： 针对 AI 有时仅能部分理解复杂指令的问题，新版 Flash-Lite 在理解复杂指令和系统提示方面有了长足的进步，能更准确地执行要求。
不再冗长，言简意赅： 旧模型有时会提供过于冗长的答案，增加延迟和 token 成本。此次更新大幅降低了模型的冗长度，使其能给出更简洁、精确的回答，这对需要高吞吐量的应用场景是一大助益。实际上，输出 token 数（即成本）降低了 50%。
更强大的多模态与翻译能力： Flash-Lite 在多模态能力上有所增强，包括更准确的语音转录、更深入的图片理解，以及更流畅的翻译品质。

开发者可透过以下模型字串开始测试： gemini-2.5-flash-lite-preview-09-2025

Flash：AI 助理的全面进化

此次的 2.5 Flash 模型更新，直接回应了 Google 从开发者社群收到的两大核心回馈：

更聪明的工具使用能力： Google 改进了模型使用工具的方式，使其在处理复杂、多步骤的代理人（agentic）应用时表现得更好。这让 AI 能独自完成更复杂的任务。在关键的 SWE-Bench Verified 基准测试中，新模型的表现提升了 5%，从 48.9% 上升到 54%，是一项显著的进步。
更高的效率，更低的成本： 新模型提供了极高的成本效益，能以更少的 token、更短的延迟时间，产出更高品质的结果。图表显示，Gemini 2.5 Flash 的输出 token 数减少了 24%，意味着成本直接下降。

早期测试者已给出许多正面评价。例如，自动化 AI 代理公司 Manus 的联合创始人兼首席科学家 Yichao ‘Peak’ Ji 提到：「新的 Gemini 2.5 Flash 模型完美结合了速度与智慧。我们的内部基准测试显示，在处理长远规划的代理任务时，其性能提升了 15%。它卓越的成本效益使 Manus 能够扩展到前所未有的规模。」

若要体验此版本，可使用以下模型字串： gemini-2.5-flash-preview-09-2025

为开发者设计：迎接 `-latest` 别名时代

Google 方面表示，过去一年的经验显示，发布模型的预览版本能让开发者第一时间测试最新的功能与创新，并提供宝贵的回馈，有助于打造更稳定、更出色的正式版 Gemini。

为了让开发者能更轻松地取用最新模型，同时减少追踪冗长模型字串的麻烦，Google 特别为每个模型系列引入了 -latest 别名（alias）。这个别名将永远指向该系列最新的模型版本，让开发者无需为每次更新而修改程式码，就能轻松实验新功能。

开发者可透过以下方式使用新的预览版：

gemini-flash-latest
gemini-flash-lite-latest

为确保开发者能安心测试，在 Google 更新或弃用 -latest 背后的特定版本之前，都会提前两週透过电子邮件通知。但须注意，这些只是模型别名，费率限制、成本和可用功能可能会随着版本发布而变动。

如果应用程式需要更高的稳定性，Google 建议开发者继续使用明确指定版本的模型，例如 gemini-2.5-flash 和 gemini-2.5-flash-lite。

Google 将继续探索 AI 的无限可能，此次的发布只是其前进路上的一步，未来将有更多消息发布。

分享到:

Featured Partners

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

Recommended for You

A …

news

AI 日报 Google 全面更新 Gemini 3 模型与开发工具，Antigravity 平台重新定义代码编写

Google 本周发布了震撼科技圈的重大更新，不仅推出了推理能力大幅提升的 Gemini 3 模型，更展示了全新的 Antigravity 开发平台，试图彻底改变开发者与 AI 的协作模式。从终端的 CLI 工具到学术研究的 Scholar Labs，甚至是微软与 Anthropic 的战略结盟，本文将深入剖析这些变革如何影响未来的工作流。科技圈的节奏总是让人目不暇给，这周的更新尤其令人感到兴奋。Google 似乎决定在同一时间释放所有累积已久的研发能量，从底层模型到终端应用，几乎每一个环节都迎来了重大升级。这不仅仅是版本号的跳转，更像是一种宣告：AI 正在从单纯的对话机器人，转变为能够主动规划、执行并完成复杂任务的“代理人”（Agent）。如果您是一名开发者，或者密切关注 AI 工具如何改变工作方式的人，那么 Gemini 3 的发布以及伴随而来的 Antigravity 平台，绝对是值得花时间深入了解的转折点。这篇文章将详细拆解这些新工具的实际应用场景，并整合最新的产业动态。 1. Gemini 3：推理与“Vibe Coding”的全新高度 Google 正式推出了 Gemini 3 模型，这是目前该公司最智慧的模型。这次升级的核心不在于单纯的数据堆叠，而在于“推理能力（Reasoning）”的质变。什么是 Vibe Coding？大家可能听过“Prompt Engineering”（提示工程），但 Gemini 3 强调的是 “Vibe Coding”。这是一个相当有趣的词汇，意指开发者不再需要拘泥于完美的语法或死板的指令，而是可以透过自然语言，将脑中的“感觉”或“高层次想法”传达给 AI。 Gemini 3 在处理模糊指令、长文本上下文（Context）以及复杂工具调用方面表现出色。这意味着，当您说“做一个看起来很复古、有点 80 年代风格的网页游戏”时，它不仅能理解您的美学要求，还能处理背后的多步骤规划、编写代码并生成丰富的视觉效果。视觉与空间推理的突破除了文字和代码，Gemini 3 在多模态（Multimodal）理解上也设下了新标准：影片推理（Video Reasoning）：它能以高帧率理解影片内容，从长达数小时的影片中精准定位特定细节，这对于影片剪辑或内容分析来说极具价值。空间推理（Spatial Reasoning）：这点对于机器人技术和 XR（扩展现实）装置至关重要。模型现在能更准确地预测轨迹、理解萤幕上的使用者意图（例如滑鼠移动的路径），这为未来的自动化操作铺平了道路。 2. Google Antigravity：不只是 IDE，这是 AI 代理的基地如果说 Gemini 3 是大脑，那么 Google Antigravity 就是它的身体与工作站。

Nov 19, 2025 Read →

G …

news

Gemini 3 强势登场：从“Vibe Coding”到 SVG 艺术，它如何重塑开发体验？

Google 正式推出 Gemini 3，这不仅是模型参数的升级，更是“代理编码 (Agentic Coding)”的实际应用落地。从击败 GPT-5.1 的基准测试数据，到全新的 Google Antigravity 开发平台，本文将带您深入了解 Gemini 3 如何透过强大的推理能力与 SVG 生成技术，彻底改变开发者的工作流程。我们更将透过一张“骑单车的鹈鹕”SVG 图像，实证其惊人的空间理解力。科技圈总是不缺新名词，但当 Google AI Studio 的产品负责人 Logan Kilpatrick 说出：“无论你是经验丰富的开发者，还是只凭感觉写程式的 ‘Vibe Coder’，Gemini 3 都能帮你将任何想法变为现实”时，我们知道这次的情况不太一样。 Gemini 3 的出现，标志着 AI 助手从“聊天机器人”正式转职为“行动代理人 (Agent)”。它不再只是被动地回答问题，而是建立在最先进的推理基础上，主动规划、执行并解决复杂问题。核心概念：什么是“代理编码 (Agentic Coding)”？过去我们使用 AI 写程式，往往是“一段一段”地贴上代码，然后自己当胶水把它们黏起来。Gemini 3 试图改变这个流程。透过新推出的 Google Antigravity 平台，开发者与 AI 的关系发生了变化。开发者现在更像是一位“架构师”，负责制定高层次的目标；而 Gemini 3 则指挥多个 AI 代理人，在编辑器、终端机 (Terminal) 和浏览器之间协作。这意味着模型可以处理长跨度 (Long-horizon) 的任务。例如，它可以在整个代码库中进行重构、除错，甚至实作新功能，而不会因为档案太多而“忘记”上下文。这解决了过去模型在处理多档案专案时容易断片的问题。 Vibe Coding：自然语言就是唯一的语法 “Vibe Coding”是这次发布中最有趣的词汇之一。它的核心理念是：只要感觉对了，程式就出来了。得益于 Gemini 3 强大的指令依从性 (Instruction Following)，开发者不再需要深陷于繁琐的语法细节。你只需要用自然语言清晰地描述你的“Vibe”（想法或创意），模型就能处理背后复杂的多步骤规划和实作。Google AI Studio 的“Build Mode”甚至允许用户只用一个提示词，就生成一个功能完整的全端应用程式。

Nov 19, 2025 Read →

A …

news

AI日报：OpenAI客户破百万、Gemini API重大更新、UMG与Udio联手重塑AI音乐版图

2025年11月6日，AI领域风起云涌。OpenAI迎来百万企业客户的里程碑，Google持续强化其Gemini生态系统，而音乐产业巨头UMG与AI新创Udio的历史性和解，更可能彻底改变AI生成内容的未来游戏规则。本文将带您快速掌握今日最值得关注的AI发展。 OpenAI的新花招：ChatGPT查询可以“插队”了你有没有过这种经验？向ChatGPT下了一个复杂的指令，看着它辛苦地跑了半天，才突然想到：“哎呀，有个重点忘了说！”结果只能眼睁睁看着它生成完不满意的答案，然后重来一次。好消息是，这种令人扼腕的时刻可能要成为历史了。OpenAI宣布为ChatGPT推出查询暂停功能。现在，当你发现一个正在运行的查询需要调整时，可以直接打断它，加入新的背景信息或修改需求，而不需要从头开始。这功能听起来简单，但对于需要深度研究或使用像GPT-5 Pro这种强大模型的用户来说，简直是天大的福音。模型会根据你“插队”的新指令即时调整回应方向，让整个互动过程变得更加流畅且高效。你只需要在侧边栏点击“更新”，就能轻松补充细节或澄清要求。 Google不断进化：Gemini API结构化输出更听话了 Google宣布强化Gemini API的结构化输出（Structured Outputs）功能。这次更新扩大了对OpenAPI的支持，并且能更好地遵循开发者在schema中定义的属性顺序。这代表什么？简单来说，就是Gemini现在更能精准地按照你设定的“模板”来回复。这对于数据撷取、自动填写数据库等任务至关重要。更棒的是，这也为复杂的多代理（multi-agent）系统铺平了道路——一个代理的标准化输出，可以直接变成下一个代理的标准化输入，中间不再需要繁琐的格式转换，让协作变得天衣无缝。 Gemini CLI工具链更新，开发者生态系再扩张不只API，Google同样在为开发者打造更便利的命令行工具。最新的Gemini CLI v0.12.0版本更新带来了一系列令人兴奋的功能。最引人注目的就是加入了三个新的合作伙伴扩展功能： Hugging Face：让开发者可以直接在命令行中存取Hugging Face Hub的庞大资源。 Monday.com：可以用自然语言分析你的项目进度、更新任务看板。 Data Commons：能够查询庞大的公开数据集，让你的AI回应有更扎实的数据支撑。此外，这次更新还推出了“智慧模型路由”功能。Gemini CLI会自动判断你的任务复杂度，简单的查询就交给轻巧的Flash模型，复杂的分析或创意任务则动用更强大的Pro模型。这样不仅能确保最佳效果，还能聪明地节省你的API配额。当然，如果你想自己指定模型，也随时可以手动切换。 Perplexity的野心：在AWS上启用万亿参数模型当模型参数达到万亿级别时，如何有效率地运行就成了一大挑战。单一节点的GPU内存根本无法负荷，必须依靠多节点部署。知名AI公司Perplexity发布了他们最新的研究成果：一套能在AWS EFA（Elastic Fabric Adapter）上高效运行万亿参数模型的MoE（Mixture-of-Experts）内核。这项技术突破解决了在多节点之间进行专家并行运算时的延迟问题，其性能甚至超越了现有的顶尖方案。简单来说，Perplexity找到了在云端平台上部署超大规模模型的钥匙，让这些过去只存在于顶尖实验室的“巨兽”模型，有了商业化应用的可能。 Cursor新突破：用语义搜索让AI Agent更懂你的代码 AI写代码的工具越来越多，但要让AI真正理解一个庞大而复杂的代码库，并做出精准的修改，依然非常困难。 AI代码编辑器Cursor发表文章，阐述他们如何通过“语义搜索”大幅提升其Agent的准确率。传统的grep指令只能做文字匹配，但Cursor训练了自家的嵌入模型，让Agent能用自然语言理解代码的“意图”。例如，你可以直接问：“我们在哪里处理身份验证？”Agent就能精准定位到相关的代码片段。根据他们的A/B测试，在引入语义搜索后，AI Agent的问答准确率平均提升了12.5%，在大型代码库中，代码的留存率（即AI写的代码被开发者保留下来的比例）甚至提高了2.6%。这证明了，要让AI成为真正的开发伙伴，深度理解是不可或缺的一步。 OpenAI的商业化大成功：达成百万企业客户里程碑从一个非营利研究机构，到如今成为AI领域的商业巨头，OpenAI的成长速度令人惊叹。OpenAI骄傲地宣布，他们已经达成了100万企业付费客户的里程碑，成为史上成长最快的商业平台之一。这个数字涵盖了所有付费使用OpenAI技术的组织，无论是通过ChatGPT for Work，还是直接使用其开发者平台。从金融服务、医疗保健到零售业，Amgen、Cisco、摩根士丹利等行业巨头都已加入其客户行列。随着企业客户的激增，OpenAI也推出了更多为企业设计的工具，例如AgentKit和“公司知识库”，帮助企业更轻松地将AI整合到内部运营和团队工作流程中，实现从个人使用到全公司范围的影响力转变。音乐产业大地震：UMG-Udio协议背后的权力游戏最后，让我们来关注一则可能对整个生成式AI领域产生深远影响的新闻。环球音乐集团（UMG）与AI音乐生成平台Udio达成了一项历史性的协议。这不仅仅是为了解决一场重大的版权诉讼，更是对AI音乐市场未来架构的根本性重塑。这项协议，特别是其核心的“禁止下载”政策，象征着AI音乐“蛮荒西部”时代的终结。核心剖析：“禁止下载”的真正目的这场戏剧性转变的起点是UMG等唱片公司对Udio的版权诉讼，指控其使用大量受版权保护的音乐来训练模型。然而，UMG的目的显然不是要摧毁Udio，而是要收编它。协议的核心机制，就是Udio立即实施的“禁止下载”政策。这项政策不仅禁止下载MP3，更关键的是禁止下载“分轨（stems）”文件。对于音乐制作人来说，无法导出单独的乐器音轨，意味着Udio从一个专业创作工具，降级成了一个业余的音乐玩具。此举的策略意图非常明显：建立一个“围墙花园”。所有AI生成的音乐都被永久地困在Udio平台内部，无法被汇出到Spotify、YouTube等平台与UMG的官方曲库竞争，从而遏止了市场蚕食的威胁。双方得失：谁是赢家？谁是输家？对UMG而言：这是一次巨大的战略胜利。他们不仅消除了法律威胁，还将AI从一个竞争对手，转变为一个受其控制、可被追踪和货币化的新型态消费模式。未来，粉丝在Udio上每一次生成“Taylor Swift风格”的音乐，都可能为UMG和Taylor Swift带来收入。对音乐制作人（用户）而言：这无疑是灾难性的。他们在一夜之间丧失了对自己创作成果的所有权和控制权。Udio的价值从一个能产生“资产”（歌曲文件）的工具，变成了一个只能提供短暂娱乐的“体验”。这也迫使专业创作者转向AIVA、Suno Pro等仍提供所有权和商业权利的平台。对AI产业而言： Udio的“倒戈”让其昔日盟友Suno在法律上陷入极度孤立。Udio等于公开承认了其未经授权的训练方式存在法律问题，这使得Suno坚持的“合理使用”辩护变得不堪一击。UMG现在可以集中所有火力，在法庭上寻求对Suno的彻底胜利，为整个AI产业树立一个永久性的法律先例：“授权或者灭亡”。这场协议划定了AI音乐市场的新规则。未来，AI平台将面临一个严峻的选择：要么像Udio一样，与版权方合作，成为一个封闭但合法的“围墙花园”；要么像AIVA一样，专注于服务需要所有权和专业工具的利基市场。而试图游走在灰色地带的“Suno路线”，其战略可行性正变得越来越低。

Nov 6, 2025 Read →

Google Gemini 再进化：全新 2.5 Flash & Flash-Lite 登场，更快、更省、更聪明

表 1：智慧 vs. 端到端回应时间

表 2：输出 Token 效率

Flash-Lite：更精准、更简洁，且具备更强的多媒体能力

Flash：AI 助理的全面进化

为开发者设计：迎接 -latest 别名时代

DMflow.chat

videoweaver.app

DMflow.chat

DMflow.chat

videoweaver.app

DMflow.chat

Recommended for You

AI 日报 Google 全面更新 Gemini 3 模型与开发工具，Antigravity 平台重新定义代码编写

Gemini 3 强势登场：从“Vibe Coding”到 SVG 艺术，它如何重塑开发体验？

AI日报：OpenAI客户破百万、Gemini API重大更新、UMG与Udio联手重塑AI音乐版图

为开发者设计：迎接 `-latest` 别名时代