Claude Sonnet 4 支持百万 Tokens 上下文：容量提升 5 倍，支持 7.5 万行代码一键处理

InfoQ 10月前 333 阅读

Anthropic 宣布，Claude Sonnet 4 现已支持 100 万 tokens 上下文长度，将此前 20 万 tokens 的上限直接提升 5 倍。这使得你可以通过一次请求处理超过 7.5 万行代码的完整代码库，或多篇科研论文。

对于开发者而言，这一升级是 Claude Code 的“猛兽级”增强，能够通过 API 一次性处理海量代码库或文档，不再需要繁琐的内容拆分与分批上传，甚至有可能用它来重构整个应用。

Anthropic 表示，基于这个上下文长度，开发者可以用 Claude 来进行大规模代码分析，比如一次性加载完整代码库，涵盖源代码、测试文件和文档，从而识别项目架构与跨文件依赖，提供整体优化建议。

值得注意的是，20 万 tokens 上下文窗口曾被视为 Claude Sonnet 的“致命弱点”，而如今这一短板终于补齐。目前，该功能仅向 Tier 4 用户（即 API 消费累计达到 400 美元以上的账户）开放。根据官方文档，要启用 100 万 tokens 上下文窗口，开发者需要在 API 请求中添加 context-1m-2025-08-07 beta 标头。

更有意思的是，这次更新也是 Anthropic 首次根据上下文长度分级定价：

≤ 200K tokens：输入 $3 / 百万 tokens，输出 $15 / 百万 tokens
> 200K tokens：输入 $6 / 百万 tokens，输出 $22.50 / 百万 tokens

事实上，在此之前，Gemini 和 OpenAI 已率先推出百万 token 级模型。其中，Gemini 早已实施类似分级，Gemini 2.5 Pro 在 200K 以下的价格为 $1.25 / $10，以上则为 $2.50 / $15。从实际效果来看，有用户表示，Sonnet 4 相较于 Gemini 2.5 Pro，响应更快、表达更简洁，同时对细节把握更到位，非常适合用作 AI 代理，缺点就是价格太贵。