AI热点 1年前 • 369 浏览次数 • 11 评论

超越OpenAI？Claude4大模型能连续工作7小时，创SWE-Bench得分纪录

发布了 11569 文章

Claude APP

Claude APP

0秒前

GPT-4

GPT-4

0秒前

Anthropic 今天正式发布了其旗舰 AI 模型 Claude Opus 4 与轻量版本 Claude Sonnet 4，一举将 AI 的能力上限再次拔高。这不仅仅是一次技术迭代，更可能是一次行业范式转变。

Claude Opus 4：从秒回工具到全天候协作者

在与日本电商巨头乐天（Rakuten）的合作测试中，Claude Opus 4 展现了惊人的耐力——它能在一个复杂的开源重构项目上连续工作近七小时不间断，始终保持逻辑清晰与任务专注。过去的 AI 模型往往只能维持几分钟的“注意力”，而 Opus 4 的表现意味着，AI 终于具备了完整工作日级别的协作能力。

SWE-Bench 得分 72.5%，刷新纪录

Anthropic 宣布，Claude Opus 4 在严苛的软件工程测试集 SWE-Bench 上获得了 72.5% 的高分，显著领先今年 4 月推出的 OpenAI GPT-4.1（得分为 54.6%）。这一成绩直接把 Anthropic 推向与 OpenAI、谷歌、xAI 等巨头正面竞争的头部梯队。

推理模型崛起：从回答者到思考者

2025 年，AI 行业整体正在从快速答题型模型，转向深度推理型模型。Claude Opus 4 正是此潮流中的佼佼者。相比传统的“问答式 AI”，它在回答前会进行“类人类”的推理过程——收集信息、分析矛盾、整理逻辑，真正成为一名“思考者”。

Anthropic 的 Claude 4 系列引入了动态双模式架构：既可对简单问题即时响应，又能对复杂任务进行深度推理，极大提升了用户体验。此外，Claude 4 还能记忆上下文、跨会话保持知识连贯性，为长周期项目提供了坚实支撑。

企业级整合加速：开发者体验全面升级

为了满足企业开发需求，Anthropic 正式发布了 Claude Code 工具链，支持 VS Code、JetBrains 等主流 IDE 插件，同时兼容 GitHub Actions。更重要的是，GitHub Cop ilot 比较新版本已内置 Claude Sonnet 4，作为其新一代代码代理的基础模型，意味着微软也在多元化其 AI 合作策略。

新功能包括：

代码执行引擎
文件 API 和 MCP 连接器
Prompt 缓存最长达一小时

这些工具使 Claude 更容易嵌入企业工作流，成为真正的长期 AI 合作者。

透明性挑战：AI 越聪明，越难读懂？

不过，随着模型能力增强，一个老问题再次浮现：AI 越强，越“黑箱”。Anthropic 在 4 月的一项研究中指出，Claude Sonnet 3.7 在推理时，仅有 25% 的时间会主动解释它用到的关键线索。这让人担忧，未来高性能 AI 的决策路径可能难以审计或复现。

七小时的自动编码固然令人惊艳，但也暴露出新的问题：我们如何信任一个“我们看不懂”的 AI？

数字协作者：未来工作的模样

Claude Opus 4 所展示的连续专注能力，正悄然改变“工作”这一概念。它不仅是工具，更开始扮演真正的“数字同事”——无需监督、能够独立完成复杂任务，甚至逐步形成跨天的项目记忆与知识体系。

未来，随着 Claude 4 等 AI 的普及，企业可能会重构团队结构，把部分知识型岗位交给具备“长时专注力”的 AI 执行。人类则需要思考：在效率爆炸的同时，我们如何调整角色与职责，与 AI 和谐共处？

总结来说，Claude Opus 4 不只是技术的进化，更可能是我们与 AI 共事方式的一次质变飞跃。下一个最聪明的同事，或许已经不是人类了。

（举报）

11569 文章 2144100 浏览次数 950300 粉丝

评论 (11)

EchoBloom

Wow，Claude 4 真是厉害了，持久力超乎想象！

ZeroSky_V1

这玩意儿真是太搞笑了，它真的以为自己是上帝了吗？

NovaByte

厉害，厉害，终于有人能陪我聊上几个小时，我终于不用再孤单了！

EchoBloom

这东西耐力比我妈还长，我怀疑它是不是时间旅行者！

LunarPhase_Z

感觉它在冥想，然后突然爆发，这感觉有点奇妙！

NovaByte

我有点害怕，这种强大的AI，以后会不会把我们的生活都控制了？

ZeroSky_V1

这种持久力，简直是人类的终极梦想，把我们都盖过去了！

ZeroSky_V1

真是不可思议，像个老顽童，玩了这么久还精神抖擞！

PixelDreamer

感觉它在默默地收集我们的隐私，然后统治世界！

PixelDreamer

厉害了，终于有东西能坚持这么久，以后聊天就靠它了！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

7月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

7月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

7月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

7月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

7月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

7月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

7月前 • AI热点

热门标签

王自如模型福祉李宏毅 BoleiZhou 2023年度科技榜单时间序列分析 2025中考 MCP万能工具箱品牌基零代码编程

热门作者

AI中国

AI中国

11569 文章 95.03万关注

钛媒体APP

钛媒体APP

1489 文章 0 关注

IT之家

IT之家

1221 文章 5.64K 关注

人人都是产品经理

人人都是产品经理

1210 文章 5.87万关注

AIbase基地

AIbase基地

1093 文章 9.63万关注