AI代理

亚马逊推出Nova Act:进军AI代理市场的新举措

亚马逊周一发布了Nova Act,这是一款能够控制网络浏览器并独立执行简单操作的通用AI代理。同时推出的还有Nova Act SDK,允许开发人员使用Nova Act构建代理原型。Nova Act由亚马逊在旧金山新设立的AGI实验室开发,这也将为该公司即将推出的Alexa+(亚马逊语音助手的生成式AI增强版)提供关键功能。不过目前发布的Nova Act版本被定位为"研究预览版",开发人员可通过no

微软 CTO:产品经理在 AI 培训中发挥重要作用

微软的首席技术官凯文・斯科特(Kevin Scott)强调了产品经理在训练 AI 代理方面的重要性。根据他的说法,产品经理不仅是产品设计和开发的核心,还在创建 “反馈循环” 中发挥着至关重要的角色。这些反馈循环可以帮助 AI 代理不断学习和改进其执行任务的能力,从而更好地满足用户需求。凯文・斯科特指出,AI 系统的有效性在很大程度上依赖于人类的反馈。产品经理通过收集用户的反馈意见,并将这些信息传递

OpenAI推出AI Agent评测基准PaperBench

OpenAI 团队推出了一个名为 PaperBench 的基准测试,旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议(ICML)中的重点和口头论文,整个过程涉及理解论文贡献、开发代码库以及成功执行实验。为确保评估的客观性,研究人员设计了详细的评分标准。这些标准将每项复制任务分解为多个层级的子任务,并设定明确的评分标准。PaperB

Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力

近日,人工智能领域迎来了一项引人注目的技术突破——Genspark正式推出了其全新自动化AI代理“Super Agent”。这一智能系统以其强大的自主思考、任务规划与执行能力,迅速成为行业焦点。据悉,Super Agent不仅在功能上与此前备受关注的Manus相媲美,还通过独特的“多智能体混合系统”(Mixture-of-Agents)设计,展现了在多样化场景下处理任务的卓越性能,为用户带来了从日

Cloudflare 发布 Node.js 生态 Agents 开发包,助力 AI 代理开发

近日,Cloudflare 推出了一款面向 Node.js 生态的 Agents 开发包,为开发者提供了一套完整的 AI 代理开发基础设施。这一开发包集成了多项核心功能,包括工作流引擎、工具集成框架、多代理协作平台(MCP)以及状态持久化支持,旨在简化 AI 代理的构建与部署流程。据介绍,该开发包能够帮助开发者轻松实现自动化任务执行、多工具协同以及动态适应上下文的能力。Cloudflare 官网还

PokemonGym:AI玩宝可梦Red,Claude仅用450步征服

在人工智能领域不断突破的今天,一个名为 PokemonGym 的创新项目正悄然兴起,引起了游戏爱好者和AI研究者的广泛关注。PokemonGym 是一套专门为评估人工智能(AI)代理在经典游戏《宝可梦Red》中表现的服务平台。通过构建一套完善的服务器-客户端架构,PokemonGym 使得开发者可以训练和测试各种AI算法在虚拟的游戏世界中自主行动。PokemonGym的核心功能:让AI自主探索宝可

阿里巴巴已宣布全面支持MCP协议 腾讯紧随其后

近日,中国人工智能领域迎来了一场技术标准的悄然变革——Model Context Protocol(MCP)正以迅猛之势成为国内AI生态的事实标准。据业内最新动态,阿里巴巴已宣布全面支持MCP协议,而腾讯也紧随其后加入这一阵营。与此同时,部分平台如Coze因反应迟缓而备受关注。这一趋势不仅凸显了MCP在AI代理开发中的核心地位,也预示着中国科技巨头在全球AI标准竞争中的新一轮角力。MCP作为一种新

Adobe将推PS和PR AI代理,智能编辑更轻松

据报道,Adobe 正在为其创意软件生态系统注入新的 AI 技术,计划推出 Photoshop 和 Premiere Pro 的 “AI 代理” 功能。这一升级旨在简化用户的编辑过程,提升创作效率。在 Photoshop 中,全新的 “创意代理” AI 助手将以智能浮动面板的形式出现,能够实时分析图像内容,并为用户提供精准的编辑建议。无论是智能背景处理,还是景深优化,用户只需简单点击,就能完成以往

OpenAI开源BrowseComp,衡量 AI 代理浏览网页能力的新基准

人工智能领域的测试标杆再添新成员!OpenAI宣布开源BrowseComp,一个专为评估AI代理网络浏览能力设计的创新基准测试。这一举措不仅为AI研究社区提供了全新的工具,也为推动更智能、更可靠的浏览代理奠定了基础。AIbase为您深入解读BrowseComp的核心价值与行业影响。BrowseComp:AI浏览能力的“终极试炼”BrowseComp,全称“Browsing Competition”