Claude Sonnet 4 迎来百万 Token 时代：一次读懂整座代码库不再是梦

Anthropic 震撼宣布，旗下 AI 模型 Claude Sonnet 4 现已支持高达 100 万 Token 的上下文长度，这项 5 倍的跃升将彻底改变开发者与 AI 互动的方式。想象一下，未来 AI 能一口气读完超过 75,000 行的代码，或是同时消化数十篇研究论文。这不仅是技术的突破，更是开发新典范的开端。

你有没有想过，如果 AI 能够一次性地理解你整个项目的来龙去脉，那会是怎样一番光景？不再需要零碎地喂给它片段信息，也不用再担心它忘记了几分钟前的对话。听起来像科幻小说吗？但现在，这一切正在变为现实。

人工智能公司 Anthropic 近日投下了一颗震撼弹：其广受欢迎的模型 Claude Sonnet 4，现在通过 API 支持高达 100 万 Token 的上下文窗口 (Context Window)。这数字代表着什么？简单来说，容量是过去 20 万 Token 的整整五倍。

这意味着，你现在可以把超过 75,000 行代码的庞大项目，或是数十篇充满专业术语的研究报告，一次性地交给 Claude。这不仅仅是量变，更是质变的开始。

当上下文不再是束缚：解锁全新应用场景

过去，AI 模型的记忆力就像一个小小的笔记本，容量有限，常常需要开发者费尽心思，通过像是「检索增强生成 (RAG)」这类复杂技术来弥补。但现在，随着上下文窗口的大幅扩展，许多过去难以实现的应用场景，如今都变得触手可及。

想象一下这些可能性：

大规模代码分析： 你可以把整个代码库，包含原始文件、测试案例和所有相关文件，全部丢给 Claude。它能深入理解项目的整体架构，找出跨文件的依赖关系，并从全局视角提出改进建议。这就像有了一位能瞬间消化整个项目的资深架构师在身边。
海量文件整合与分析： 面对成堆的法律合约、学术论文或技术规格书，再也不用头痛了。Claude Sonnet 4 能够一次处理数百份文件，并在充分理解全文的基础上，分析它们之间的复杂关联。
更聪明的「代理人」(Agent)： 未来的 AI 助理将能执行更复杂、更多步骤的工作流程。归功于超长上下文，AI Agent 可以在数百次的工具调用和互动中，始终保持对话的连贯性，不会「失忆」或偏离主题。

来自伦敦的 iGent AI 公司，正是这项技术的早期受益者。他们的 AI 软件工程伙伴 Maestro，在整合了百万 Token 的 Claude Sonnet 4 后，实现了前所未有的自主能力。其共同创始人 Sean Ward 兴奋地表示：「过去不可能的事，现在成真了。这项飞跃解锁了真正的产品级工程能力，为代理人软件工程树立了新的典范。」

百万 Token 的代价？价格策略与成本考量

当然，更强大的计算能力也意味着成本的调整。Anthropic 对此也提出了新的定价策略。当你的提示 (Prompt) 长度超过 20 万 Token 时，费用会有所不同：

提示长度 (Token)	输入 (每百万 Token)	输出 (每百万 Token)
≤ 200K	$3 美元	$15 美元
> 200K	$6 美元	$22.50 美元

数据来源：Anthropic 官方定价页面。

可以看到，当处理超长文本时，输入成本增加了一倍，输出成本则增加了 50%。不过，Anthropic 也贴心地提供了省钱妙方：结合使用「提示词缓存 (Prompt Caching)」和「批处理 (Batch Processing)」，最高可以节省 50% 的成本，同时还能降低延迟。

如何开始体验？

目前，这项强大的长上下文功能已在 Anthropic API 进入公开测试阶段，主要提供给 Tier 4 等级及以上的客户。同时，它也已经登陆 Amazon Bedrock，并即将在 Google Cloud 的 Vertex AI 上提供。这也让 Anthropic 在与 Google Gemini 和 OpenAI GPT 系列的竞争中，补上了关键的一块拼图。

另一家早期采用者 Bolt.new 的首席执行官 Eric Simons 也分享道：「在代码生成工作流程中，Claude Sonnet 4 始终是我们的首选模型… 借由百万 Token 的上下文窗口，开发者现在可以处理规模大得多的项目，同时维持我们所需要的高准确性。」

这项更新不仅仅是数字上的增长，它更像是在 AI 的大脑里，扩建了一座巨大的图书馆。对于追求更高效率、更深度分析的开发者和企业来说，这无疑是一个令人振奋的消息。AI 的能力边界，又一次被我们向前推进了一大步。

常见问题解答 (FAQ)

问：这次更新只针对 Claude Sonnet 4 吗？最强的 Opus 4 模型呢？ 答：是的，目前 100 万 Token 的长上下文功能仅在 Claude Sonnet 4 上推出。Anthropic 尚未公布是否或何时会为其旗舰模型 Claude Opus 4 提供同样的升级。

问：什么是 Token？100 万 Token 大概是多少文字？ 答：Token 是 AI 模型处理文本的基本单位。简单来说，100 万 Token 大约相当于 75 万个英文单词，其长度超过了《魔戒》三部曲的总和。

问：除了 API，我可以在 Claude 的聊天网页或 App 上使用百万 Token 功能吗？ 答：目前这项功能主要通过 Anthropic API、Amazon Bedrock 等平台提供给开发者和企业客户，尚未在面向一般消费者的 Claude 聊天界面中提供。

问：处理这么长的文本，AI 的准确性还能保证吗？ 答：这是一个很好的问题。学界和业界常用「大海捞针」测试来评估模型在长文本中寻找特定信息的能力。多数主流模型在此类测试中表现良好。而从 Bolt.new 和 iGent AI 等早期用户的反馈来看，Claude Sonnet 4 在处理大型项目时，依然能维持所需的高准确度。

分享到:

Featured Partners

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

Recommended for You

2 …

news

2025-11-05 AI 日报-Anthropic 封锁中资、Perplexity 杠上亚马逊、Google 发布太空 AI 计划

今日 AI 领域风波不断。Anthropic 因应地缘政治压力，开始封锁具中资背景的企业使用其模型，直接冲击字节跳动旗下平台。同时，新创公司 Perplexity 公开指控亚马逊利用法律手段打压其 AI 助理。技术方面，Google 发布了名为「Suncatcher」的太空 AI 运算计划，展现了将机器学习推向新边界的野心。 1. 地缘政治影响浮现：TRAE 停止提供 Claude 模型由于其母公司 Anthropic 的新政策，AI 服务平台 TRAE 已停止提供 Claude 模型。此举背后反映了日益紧张的地缘政治局势与科技保护主义的抬头。背后原因：地缘政治与技术保护主义这次服务中断的直接导火线是 Anthropic 于 2025 年 9 月 5 日宣布的一项严格封锁政策。该政策明确指出，任何由中国公司直接或间接持股超过 50% 的企业，不论其注册地点位于何处，都将被禁止使用 Claude 系列 AI 服务。 TRAE 平台虽然由字节跳动位于新加坡的子公司 SPRING 负责营运，但由于其显著的中资背景，依然被列入了这次的封锁名单。业界分析师认为，Anthropic 的决策主要有两个层面的考量。首先是回应来自美国的地缘政治压力，避免其先进技术流向被视为竞争对手的国家。其次，此举也是一种技术保护策略，旨在防止中国公司利用「模型蒸馏」（Model Distillation）技术——也就是以 Claude 作为强大的「教师模型」，来训练出性能相近但成本更低的自有 AI 模型，从而削弱 Anthropic 的市场竞争力。 2. OpenAI Sora App 开放更多 Android 地区下载 OpenAI 宣布，其影片生成应用程序 Sora 的 Android 版本现在已在更多国家和地区上架，包括：加拿大日本韩国台湾泰国美国越南使用者可以前往 Google Play 商店下载体验。

Nov 5, 2025 Read →

2 …

news

2025-10-30 AI日报 Cursor 2.0 与自研模型 Composer 正面对决 Cognition，Sora 限时免邀请码，AI 竟能「内省」？

2025 年 10 月 29 日（为何是 10 月 29 日，因为日报都是介绍昨日的），AI 领域迎来了惊人的爆发。AI 代码编辑器 Cursor 推出 2.0 版本及自研模型，Cognition AI 则以极速 Agent 模型应战。同时，OpenAI 的 Sora 开放了部分地区的免邀请注册，Google 为开发者送上多重好礼，而 Anthropic 的研究更揭示了 AI 模型可能具备初步的「内省」能力。今天的 AI 界真是热闹非凡！从开发者工具的重大升级，到视频生成模型的全面开放，再到关于 AI 自我意识的惊人研究，各大巨头和新创公司都在加速奔跑，竞争的火药味也越来越浓。让我们来快速盘点一下今天有哪些不容错过的重磅消息。不只是编辑器，Cursor 2.0 打造 AI 开发新范式 AI 优先的代码编辑器 Cursor 今天正式发布了其里程碑式的 Cursor 2.0 版本，带来了全新的 Agent 界面和一个令人惊喜的「杀手锏」：他们的第一款自研代理编码模型——Composer。根据官方博客的介绍，Composer 是一个前沿模型，其最大亮点在于速度——比同等智慧水准的模型快上 4 倍。这意味着开发者可以获得更即时的回应，大幅提升工作效率。除了强大的内核，Cursor 2.0 的界面也进行了彻底革新。全新的「Multi-Agents」界面允许使用者在单一提示下，最多并行运行八个 Agent。这项功能利用 git worktrees 或远程机器来避免文件冲突，让每个 Agent 都在独立的代码库副本中工作。想像一下，你可以同时让多个 AI 助手分头处理不同任务，或用不同模型解决同一个问题，然后挑选最佳方案，这简直是开发者的梦想。此外，更新日志还列出了多项改进，包括：改进的代码审查：跨多个文件的变更一目了然。沙盒终端 (GA)：在 macOS 上默认启用，提升安全性。团队指令与语音模式：让团队协作和人机互动更加流畅。速度之王登场！Cognition 发布 SWE-1.5 极速 Agent 模型就在 Cursor 推出 Composer 的同时，以 AI 工程师 Devin 闻名的 Cognition AI 似乎也闻到了挑战的气味，迅速推出了他们最新的软件工程模型 SWE-1.5。

Oct 30, 2025 Read →

2 …

news

2025年10月24日 AI 日报：OpenAI、Google、Anthropic、Microsoft 重大更新一览

掌握 2025 年 10 月 24 日最新的 AI 发展！今天，AI 领域迎来了爆炸性的一天。OpenAI 为 ChatGPT 带来了革命性的“公司知识”功能，让 AI 真正融入企业工作流程。同时，Google 推出了让应用开发更直观的 AI Studio 新模式，并大幅升级了 Google Earth AI。Anthropic 的 Claude 也没闲着，正式向个人用户开放“记忆功能”。最后，微软让经典角色“回形针”以全新 AI 形象 Mico 回归 Copilot。本文将为您深入剖析这些重大更新。 OpenAI 推出“Company Knowledge”，让 ChatGPT 更懂你的业务你是否也曾为了找一份文件，在 Slack、Google Drive 和无数封邮件中焦头烂额？工作中最需要的信息，往往像散落一地的拼图，散布在各个角落。为了解决这个长久以来的痛点，OpenAI 正式为 ChatGPT Business、Enterprise 及 Edu 用户推出了一项名为**“公司知识 (Company Knowledge)”**的强大功能。终结信息孤岛，打造企业专属大脑简单来说，“公司知识”功能就像是给了 ChatGPT 一把通往你公司内部信息库的万能钥匙。首次使用时，你只需将公司常用的应用程序（如 Slack、SharePoint、Google Drive、GitHub 等）与 ChatGPT 连接。之后，当你启用这项功能并提出问题时，ChatGPT就能夠跨平台查找所有相关资料，提供一个整合了完整上下文、专属于你公司业务的精准答案。举个例子，当你需要准备一场客户会议时，可以直接问 ChatGPT：“帮我整理一下上次与客户 A 会议后的重点，以及最近 Slack 频道中关于他们的讨论。”ChatGPT 会自动抓取 Google Docs 的会议记录、Email 中的关键细节，甚至是 Intercom 的客服问题，生成一份完整的简报。

Oct 24, 2025 Read →