全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Runway于近日正式推出Gen-4References功能，为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像，提取人物、场景或风格特征，并在生成内容中保持高度一致性，支持多张图像混合生成，为AI视频创作带来了前所未有的控制力与创意自由。核心功能解析:多图像融合与一致性控制Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至

Claude 移动应用即将推出语音模式，支持多种声音选项

Anthropic 的 Claude 移动应用即将迎来一次重要升级，新增的语音模式功能备受期待。据 TestingCatalog 周日的报道，Claude 的语音模式将采用推按式对话方式，并且支持多种声音选项。在语音模式下，Claude 不仅可以进行语音对话，还具备了网页搜索的能力。用户在使用时，搜索结果将以列出来源的方式呈现，类似于其桌面版本。输出结果会被整理成要点，使得用户更容易理解和跟进。同

Cursor母公司Anysphere完成9亿美元融资，估值飙升至90亿美元

AI编程助手Cursor的母公司Anysphere于今日宣布完成一轮高达9亿美元的融资，估值达到惊人的90亿美元。此次融资由Thrive Capital领投，知名投资机构Andreessen Horowitz（a16z）和Accel共同参与。据悉，Anysphere在今年4月1日刚刚完成上一轮融资，短短数月内估值暴涨，彰显了市场对AI编程工具的强烈信心与期待。Cursor:重塑编程体验的AI利器A

Excel MCP Server上线可通过Claude等客户端直接操作Excel文件

一款名为Excel MCP Server的开源工具近日引发热议。这款基于**模型上下文协议（Model Context Protocol， MCP）**开发的服务器，允许用户通过AI助手直接操作Excel文件，无需安装微软Excel软件即可实现高效的表格处理。GitHub项目地址为:https://top.aibase.com/tool/excel-mcp-server据悉，该工具通过AI客户端如

未来两年，AI Agent 部署将增长 327%

据最新的 Salesforce 全球调研显示，全球人力资源高管（CHRO）计划在未来两年内大幅扩展数字劳动力，特别是人工智能(AI)代理的部署，以提升生产力。这项研究对200名全球人力资源高管进行了调查，结果显示，他们一致认为 AI 代理将深刻改变组织结构。图源备注：图片由AI生成，图片授权服务商Midjourney调研结果指出，77% 的受访者相信，AI 代理将成为未来劳动力的重要组成部分。这一

KREA AI携手ChatGPT推出视觉提示编辑功能，释放图像创作新潜能

KREA AI近日推出了一项令人振奋的功能更新，通过集成OpenAI的GPT图像API，用户可利用编辑标记、基本形状、注释和参考图像，以视觉方式提示ChatGPT进行快速图像编辑。这一创新功能极大提升了图像创作的灵活性和互动性，为用户带来了前所未有的创作体验。AIbase观察到，此功能不仅展示了KREA AI在生成式AI领域的技术实力，也凸显了API在创意应用中的无限可能。核心功能解析:直观高效的

Suno v4.5 正式上线，仅限付费用户使用，生成歌曲延长至8分钟

人工智能音乐生成平台 Suno 近日正式推出其最新模型 v4.5，为音乐创作领域再添创新动力。根据 Suno 官方公告，v4.5在音质、风格多样性和用户体验上实现了显著突破，但新版本目前仅对 Pro 和 Premier 付费用户开放使用。v4.5核心升级:更丰富的音效与创作自由度Suno v4.5作为 v4系列的优化版本，带来了多项令人瞩目的技术进步。根据官方介绍，v4.5在以下方面表现尤为突出:

Waymo 计划到2026年增加2000辆机器人出租车，打造未来出行新体验

在自动驾驶技术日益成熟的背景下，Waymo 近日宣布了一项激动人心的扩张计划。该公司表示，最近已完成最后一批捷豹 I-Pace SUV 的交付，这些车辆将在亚利桑那州的工厂进行传感器和自动驾驶技术的改造，加入其机器人出租车车队。根据 Waymo 的最新消息，目前在旧金山、洛杉矶、凤凰城和奥斯汀等主要市场中，已有1500辆捷豹 I-Pace 投入运营。Waymo 计划到2026年再增加2000辆机器

阿联酋从幼儿园起普及人工智能课程，全球应效仿

阿联酋近日宣布了一项全国性计划，将人工智能（AI）作为所有学生从幼儿园到高中必修的课程。该政策将在2025-2026学年正式实施，届时所有公立学校都将把 AI 课程纳入核心教学体系。阿联酋官员表示，私人学校也可能会在国家指导下跟进这一政策，旨在为年轻一代做好迎接科技驱动未来的准备，增强他们的 AI 技能，巩固阿联酋在区域内的 AI 和数字创新领导地位。图源备注：图片由AI生成，图片授权服务商Mid

ChatGPT 访问量激增，4 月总计达47.86亿次、首次超越 X

根据权威数据分析平台 Similarweb 最新发布的2025年4月网站流量报告，OpenAI 旗下的人工智能聊天工具 ChatGPT 在全球范围内的访问量实现了历史性突破，总计达到47.86亿次，首次超过社交媒体平台 X 的40.28亿次。这一里程碑不仅凸显了 ChatGPT 的迅猛增长势头，也标志着生成式 AI 工具在全球用户中的普及度正在快速攀升。ChatGPT 流量持续攀升，展现“工作性”

Visa 推出智能商务平台，让 AI 安全购物变为现实

Visa 日前在旧金山的全球产品发布会上推出了一项名为 “Visa 智能商务” 的新平台，旨在让人工智能助手能够代表用户进行购物，这意味着 AI 将可以安全地访问用户的信用卡。Visa 的首席产品与战略官 Jack Forestell 在发布会上表示:“很快，AI 助手将能够浏览、选择、购买和管理商品。”这一平台的推出是 Visa 与多家领先 AI 公司的合作成果，包括 Anthropic、IBM

11x 创始人辞去首席执行官职务，Prabhav Jain 接任

11x 的创始人 Hasan Sukkar 于今晨在 LinkedIn 上宣布，他将辞去首席执行官（CEO）的职务，现任首席技术官(CTO)Prabhav Jain 将接任这一职位。Sukkar 将转为 “非执行董事长”，继续与 Jain 合作，专注于公司的战略方向、产品愿景、行业关系以及开拓新的市场机会。图源备注:图片由AI生成，图片授权服务商MidjourneySukkar 在 LinkedI

谷歌Gemini聊天机器人全新升级：支持多图上传和图像编辑功能

近日，谷歌的 Gemini 聊天机器人迎来了重要更新，新增了多图上传功能，这一功能目前已经向部分用户开放。以往，用户只能上传单张图片，但现在在 Gemini2.0Flash 模型的支持下，部分用户已经能够在网页端同时上传多张图片。值得注意的是，该功能尚不支持免费账户，且在某些付费高级账户中也没有完全开放。这种分阶段推出的策略可能是为了逐步评估用户的反馈。除了多图上传，谷歌还在更新中加入了 AI 图

智能助手Aicy

魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

站长之家(ChinaZ.com) 5月6日消息:今日，星纪魅族正式宣布将于5月13日举办新品发布会，推出魅族Note16系列手机及Flyme AIOS2操作系统。据官方透露，此次升级的Flyme AIOS2系统在智能交互与性能优化方面实现多项突破。Flyme AIOS2系统引入全新设计的智能助手Aicy，其界面设计更具呼吸感与动态效果，同时搭载升级后的思考引擎，可实现更精准的语义理解和场景响

开发者工具

AI日报：苹果AI国行版或随iOS 18.6月底上线；Suno v4.5正式上线；Runway发布图像一致性参考功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2，语音转录能力再提升英伟达推出的Parakeet-TDT-0.6B-V2模型在自动语音识别领域取得了显

大模型测评

上线仅7天！阿里通义千问3强势登顶全球开源模型宝座

快科技5月6日消息，近日，国际权威大模型测评榜LiveBench公布了最新一期排名，阿里巴巴开源的新一代通义千问模型Qwen3（简称千问3”）斩获全球开源模型冠军。同时，千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型，位列全球第一。据了解，LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推