Anthropic 宣布,Claude Sonnet 4 现已支持 100 万 tokens 上下文长度,将此前 20 万 tokens 的上限直接提升 5 倍。这使得你可以通过一次请求处理超过 7.5 万行代码的完整代码库,或多篇科研论文。

对于开发者而言,这一升级是 Claude Code 的“猛兽级”增强,能够通过 API 一次性处理海量代码库或文档,不再需要繁琐的内容拆分与分批上传,甚至有可能用它来重构整个应用。
Anthropic 表示,基于这个上下文长度,开发者可以用 Claude 来进行大规模代码分析,比如一次性加载完整代码库,涵盖源代码、测试文件和文档,从而识别项目架构与跨文件依赖,提供整体优化建议。

值得注意的是,20 万 tokens 上下文窗口曾被视为 Claude Sonnet 的“致命弱点”,而如今这一短板终于补齐。目前,该功能仅向 Tier 4 用户(即 API 消费累计达到 400 美元以上的账户)开放。根据官方文档,要启用 100 万 tokens 上下文窗口,开发者需要在 API 请求中添加 context-1m-2025-08-07 beta 标头。
更有意思的是,这次更新也是 Anthropic 首次根据上下文长度分级定价:
≤ 200K tokens:输入 $3 / 百万 tokens,输出 $15 / 百万 tokens
> 200K tokens:输入 $6 / 百万 tokens,输出 $22.50 / 百万 tokens
事实上,在此之前,Gemini 和 OpenAI 已率先推出百万 token 级模型。其中,Gemini 早已实施类似分级,Gemini 2.5 Pro 在 200K 以下的价格为 $1.25 / $10,以上则为 $2.50 / $15。从实际效果来看,有用户表示,Sonnet 4 相较于 Gemini 2.5 Pro,响应更快、表达更简洁,同时对细节把握更到位,非常适合用作 AI 代理,缺点就是价格太贵。
