OpenAI Responses API新增MCP支持与多项功能升级,助力智能体开发 188 0 OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。 MCP支持:简化智能体开发OpenAI通过Responses
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%! 189 0 2025年5月21日,中国AI领军企业昆仑万维正式发布天工超级智能体,一款基于自研Deep Research技术的AI Office智能代理,以其强大的多模态内容生成能力和成本仅为OpenAI40%的优势,引发全球AI社区热议。天工超级智能体由5个专家智能体和1个通用智能体组成,支持一站式生成文档、PPT、表格、网页、播客及音视频内容,其性能在GAIA基准上以82.42分超越OpenAI Deep
谷歌 DeepMind 新研究强化思维链训练,让 AI 语言模型不再“纸上谈兵” 176 0 IT之家 5 月 20 日消息,科技媒体 marktechpost 昨日(5 月 19 日)发布博文,报道称谷歌 DeepMind 团队联合约翰・开普勒林茨大学 LIT AI 实验室,通过强化学习微调(RLFT)技术,提升语言模型的决策能力。IT之家援引博文介绍,基于海量互联网数据训练的语言模型已展现出超越文本处理的决策潜力,可以通过内部知识推理,在交互环境中做出行动选择。不过这些语言模型在决策
谷歌 Project Mariner 公布,AI 智能体将全面上线 Chrome、搜索、Gemini 66 0 IT之家 5 月 21 日消息,在今日的 Google I/O 2025 大会上,谷歌公布了一个名为 Project Mariner 的项目。该项目此前命名为 Jarvis(贾维斯),在去年年底进行过测试,如今迎来新的进展。Project Mariner 是一个用于网络的 AI 智能体,将于今年到来。该工具可以与操作浏览器和其他软件,Mariner 现在可以监督多达 10 个同时进行的任务,用户
网上买衣服可虚拟试穿,谷歌 AI 搜索新功能亮相 133 0 IT之家 5 月 21 日消息,谷歌搜索今日公布了 AI 模式的多项功能,其中包括一个有趣的场景。用户在浏览电商平台的衣服时,可以选择一件特定的衣服,并提供自己的照片来创建 AI 生成的虚拟试穿照片。谷歌表示,试穿体验能够模拟深度、形状,甚至一件物品在现实生活中如何移动和拉伸,看起来更符合衣服穿在真人身上的效果。IT之家从大会获悉,如果用户对衣服满意,谷歌搜索还可以使用智能体功能去自动购买连衣裙
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头! 120 0 近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。只需
谷歌公测AI编码助手Jules:Gemini 2.5 Pro驱动,挑战OpenAI的Codex 101 0 在2025年5月20日的Google I/O开发者大会上,谷歌宣布其AI编码助手Jules正式进入全球公测阶段,面向所有拥有Google和GitHub账户的开发者开放。这一基于Gemini2.5Pro模型的异步编码代理,旨在通过自动化处理繁琐的编码任务,如修复Bug、编写测试和更新依赖,提升开发者效率。异步任务处理与GitHub无缝集成Jules通过在Google Cloud虚拟机(VM)中克隆用
从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O 81 0 在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。
谷歌推出 Project Astra,智能助理可控 Android 手机 166 0 谷歌近日正式发布了 Project Astra 的最新功能,该项目展示了其强大的智能助理能力,能够控制 Android 手机。这一技术目前已经以应用程序的形式提供给受信任的测试者,并在 Pixel9Pro 上进行了演示。在演示中,用户在修理自行车的过程中,与 Astra 进行实时对话。用户首先请求 Astra 在线查找一份 PDF 手册,Astra 随后打开文档,并以悬浮气泡的形式展示其触控操作,
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破 155 0 字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。更重要的是,BAGEL 在经典图像编辑场景中的效果优于许多领先的开源
AI起号 抖音整治 内容产业分化 虚假信息 继小红书后,抖音也开始专项治理“AI起号”! 198 0 声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。通过AI技术实现“日产千条视频、周产百个账号”,类似这样的“AI起号流水线”你有听过吗?近期,抖音开始重拳出击整治这些“AI起号”了!抖音对利用AI进行账号批量生产、传播虚假信息的黑灰产链条展开了重点打击,共清理了311条违规内容,封禁了“心x甜”等15个严重违规账号。这场针对“AI起号”的专项治理行动,近期不仅仅发生在抖音,
英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识 70 0 IT之家 5 月 21 日消息,科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。Physical AI 挑战人工智能(AI)在语言处理、数学和代码生成领域取得显著进步,但将其能力扩展到物理环境仍面临挑战
谷歌实验室推出新 AI 工具 Stitch:文字、图片可秒变 UI 设计与前端代码 201 0 IT之家 5 月 21 日消息,谷歌 I/O 2025 大会首日活动已经结束,众多更新与新工具发布,其中包括 Gemini 模型的升级、谷歌搜索中 AI 模式的更广泛推广以及用于媒体创作的全新生成式 AI 工具。而在众多亮点中,谷歌实验室(Google Labs)推出的一项名为 Stitch 的新实验项目颇为有趣。Stitch 旨在解决从构思用户界面到实现可运行代码这一过程中常见的繁琐与反复沟通
多邻国创始人:AI 教学优于人类,但学校仍将存在并承担托育功能 87 0 感谢IT之家网友 往事2016 的线索投递!IT之家 5 月 21 日消息,据《财富》20 日报道,语言学习应用多邻国近年来大举押注生成式 AI。这家以猫头鹰吉祥物闻名的公司去年在财报电话会议上曾用 AI 头像短暂“替代”CEO,更在上个月宣布将永久用 AI 取代合同工。多邻国的野心目前自然已不止于此。凭借每月 1.16 亿用户积累的大量学习数据,公司掌握了激发学习动机的方法,甚至可以在考试前
英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界 185 0 近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力
字节跳动海外版剪映 CapCut 推出 AI 营销平台 Pippit,并注册相关商标 55 0 天眼查信息显示,北京字跳网络技术有限公司近期申请注册了多枚“PIPPIT”商标,覆盖教育娱乐、科学仪器、网站服务、广告销售等多个国际分类,目前商标状态均为等待实质审查。据公开资料,Pippit AI 是字节跳动旗下视频编辑应用 CapCut(剪映海外版)新近推出的 AI 营销内容创作平台,于今年4月份正式发布。此举表明字节跳动正积极拓展其在 AI 营销领域的布局。