全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

AI变天！HeyGen发布“有灵魂”的数字人Avatar IV 一张照片秒变“戏精”数字人，表情比真人还细腻

全球知名AI视频平台HeyGen正式发布Avatar IV数字人模型。基于创新的“扩散式音频驱动表情引擎”，用户仅需一张照片、一段30秒内的语音或文本脚本，即可生成高度逼真的数字人视频，表情、动作与语义情感深度同步，引发行业广泛关注。逼真演绎，源于先进技术内核Avatar IV仅需用户上传一张照片（支持侧脸及多角度图像）和30秒内的语音/脚本，即可生成动态数字人。新模型通过分析语音的节奏、语调及情

为满足数据中心大量电力需求，谷歌将资助培训数万名美国电工

IT之家 5 月 1 日消息，当地时间周三，谷歌向路透社披露了资助数万名美国电工的培训的计划，以满足其 AI 扩展所需的大量电力需求。对于许多科技公司来说，电力供应短缺已成为推动 AI 发展并依赖能源密集型数据中心的最大挑战。这些数据中心的能耗正在推动美国电力需求的上升，同时也结束了近 20 年的需求停滞。谷歌的资助包括对电工非营利组织的 1000 万美元（IT之家注：现汇率约合 7268 万元

饿了么推出骑手 AI 助手“小饿”：可主动发出天气预警、封路提示

IT之家 4 月 25 日消息，饿了么今日宣布推出骑手智能 AI 助手“小饿”，这是国内首个基于大模型技术打造的骑手端智能体，旨在通过自然语言处理（NLP）、多模态交互及实时数据分析能力，为骑手打造专属智能伙伴，覆盖骑手的配送场景，提升骑手的效率和体验。据IT之家了解，“小饿”具有三大核心能力。语音交互与智能响应：支持语音唤醒，可直接完成接单、确认到店、查询活动等操作，减少手动点击步骤，提升操作

Reddit在搜索栏中引入AI助手，告别繁琐搜索

随着互联网的发展，搜索引擎似乎变得愈发臃肿，广告和推销内容的增多让用户感到困扰。如今，很多人已经习惯在寻找信息时先选择 “谷歌一下，某某某 Reddit”。这不仅是一种幽默，也反映了人们对 Reddit 这一社区的信赖，因为用户提供的信息往往更为真实和有用。为了解决这一问题，Reddit 在去年的时候推出了 “Reddit Answers” 功能，这是一种结合人工智能的工具，旨在为用户提供更为简洁

Grok 上线语音模式，马斯克修改昵称为“groklon rust”

IT之家 5 月 5 日消息，Grok 今日官宣，语音模式现已在 Grok 应用程序中推出，适用于所有 iOS 用户以及 Android 上的 SuperGrok 订阅者。或许是为了配合新功能的宣传，马斯克将 X 平台昵称更改为“groklon rust”，头像也进行了修改。IT之家注意到，2 月 20 日，xAI 宣布 Grok 3 免费向公众提供服务（直到服务器不堪重负为止）。在此之前，Gr

AI聊天机器人

AI实力排名洗牌：OpenAI、谷歌崛起，Anthropic下滑

这一转向专业推理能力的趋势表明AI市场正在成熟，基础文本生成功能正逐渐商品化，服务提供商被迫通过高价值能力来实现差异化，以获取溢价收入……Poe最新的使用报告显示，OpenAI和谷歌在关键AI领域中的地位持续增强，而Anthropic则出现下滑。同时，具备专业推理能力的模型正成为一场关键竞争的焦点。根据今天由Poe发布的数据（Poe是一个AI模型的集成平台），在 2025 年 1 月至 5

商汤SenseCore2.0

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划

4月14日，在北京举办的2025商汤技术交流日上，商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者，商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务，以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级，旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及

中国移动发布移动爱家 AI 拍摄眼镜与 AI 音频眼镜

IT之家 4 月 18 日消息，中国移动智慧家庭运营中心 4 月 15 日在第五届中国国际消费品博览会上发布了全新产品“移动爱家 AI 眼镜”。移动爱家 AI 拍摄眼镜与 AI 音频眼镜通过深度融入大模型，可实现智能体视频通话、跨应用联动、辅助教育、协作办公等功能。移动爱家 AI 眼镜号称配备了“三个技能”：“好耳机”：在音质方面，采用双麦 ENC 通话降噪，经过数千次的音频调试，环境噪声抑制能

OpenAI 启动先锋计划，旨在重塑 AI 模型评分体系

IT之家 4 月 10 日消息，OpenAI 宣布启动 OpenAI 先锋计划（OpenAI Pioneers Program），致力于改善当前 AI 模型的评分方式。该公司认为现有的 AI 基准测试存在缺陷，而该计划将专注于创建能够“设定优秀标准”的评估体系。随着 AI 技术在各行业的应用加速普及，深入了解并提升其在现实世界中的影响力变得至关重要。OpenAI 在其博客中指出，创建特定领域的评

Vidu Q1 系列 API 正式开放同时上线文生音频模型

近日， Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机，通过调用 API 体验 Vidu Q1模型所具备的多样化功能。此次开放的 Vidu Q1系列模型在视频生成能力上实现了显著升级。在图生视频方面，它能够依据用户提供的图像，快速生成与之相关且富有创意的视频内容，为图像赋予动态生命力;首尾帧功能则让用户可以精准控制视频的起始与结束画面，使视频呈现更加符合预期的叙事节奏;

苹果 Siri 团队大换血：AI 浪潮下，新负责人能否力挽狂澜？

感谢IT之家网友風見暉一的线索投递！IT之家 4 月 23 日消息，彭博社今天（4 月 23 日）发布博文，报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。据知情人士透露，Rockwell 从 Vision Pro 软件团队中引入多位得力干将，替换 Siri 原有领导层。其中 Ranjit Desai 负责包括底

首席执行官皮查伊：谷歌超 30% 代码现由 AI 协助编写

IT之家 4 月 25 日消息，在 Alphabet 2025 年第一季度财报电话会议上，谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）表示，公司超过 30% 的代码现由 AI 协助编写。皮查伊表示得益于 AI 模型愈发强大，以及引入 Agentic workflows（智能体工作流），AI 辅助编码在各团队中迅速普及。目前开发者频繁采纳 AI 生成建议，平均每三次代码变更中就有一次

生成式人工智能

Grok大更新！视觉能力、多语言音频处理与实时搜索功能震撼上线

由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新，其功能全面升级，不仅新增了视觉处理能力，还实现了多语言音频处理以及语音模式下的实时搜索功能。这一更新标志着Grok在多模态AI领域的重大突破，为用户提供了更智能、更便捷的交互体验。以下，AIbase将为您详细解析此次更新的亮点与意义。视觉能力突破Grok的视觉处理能力是此次更新的核心亮点之一。尽管早在2024年4月，xAI曾宣

小米推出米家无线洗地机 4 Max：活水贴边清洁臂、23000Pa 吸力，国补价 2549.15 元起

IT之家 5 月 10 日消息，小米米家无线洗地机 4 Max 现已上架京东平台并开启预约，新品配备活水贴边清洁臂、23000Pa 吸力，5 月 13 日 20:00 开售，首发价 2999 元，国补价 2549.15 元起。IT之家从商品页面获悉，新品采用活水贴边清洁臂专利，滚刷和清洁臂拥有独立的活水清洁系统，贴边清洁时活水持续喷淋浸湿清洁臂及刷头边缘，实时清水清洗边角。红外感应装置搭配智能加

拍照问夸克

夸克AI超级框

夸克 AI 超级框全新上线 “拍照问夸克” 功能

阿里巴巴旗下的夸克 AI 超级框正式推出了一项名为 “拍照问夸克” 的全新功能。这一功能的亮点在于，它能够通过 AI 相机识别图像中的人物、物体以及其他细节，进而回答用户在现实生活中的各种问题。这项技术基于先进的视觉理解与推理能力，使得用户不再需要用复杂的语言描述需求，只需简单拍照即可。“拍照问夸克” 功能的应用场景非常广泛。当用户面临复杂的物体、图表或图形时，往往难以用言语表达出自己的需求。这时

清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP

近日，星动纪元宣布，已与清华大学叉院的 ISRLab 合作，开源了首个 AIGC（生成式人工智能内容）机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中，解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作，从而极大提升机器人的策略泛化能力。值得注意的是，这一模型已在国际机器学习大会（