AI变天!HeyGen发布“有灵魂”的数字人Avatar IV 一张照片秒变“戏精”数字人,表情比真人还细腻 196 0 全球知名AI视频平台HeyGen正式发布Avatar IV数字人模型。基于创新的“扩散式音频驱动表情引擎”,用户仅需一张照片、一段30秒内的语音或文本脚本,即可生成高度逼真的数字人视频,表情、动作与语义情感深度同步,引发行业广泛关注。逼真演绎,源于先进技术内核Avatar IV仅需用户上传一张照片(支持侧脸及多角度图像)和30秒内的语音/脚本,即可生成动态数字人。新模型通过分析语音的节奏、语调及情
为满足数据中心大量电力需求,谷歌将资助培训数万名美国电工 196 0 IT之家 5 月 1 日消息,当地时间周三,谷歌向路透社披露了资助数万名美国电工的培训的计划,以满足其 AI 扩展所需的大量电力需求。对于许多科技公司来说,电力供应短缺已成为推动 AI 发展并依赖能源密集型数据中心的最大挑战。这些数据中心的能耗正在推动美国电力需求的上升,同时也结束了近 20 年的需求停滞。谷歌的资助包括对电工非营利组织的 1000 万美元(IT之家注:现汇率约合 7268 万元
饿了么推出骑手 AI 助手“小饿”:可主动发出天气预警、封路提示 196 0 IT之家 4 月 25 日消息,饿了么今日宣布推出骑手智能 AI 助手“小饿”,这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造专属智能伙伴,覆盖骑手的配送场景,提升骑手的效率和体验。据IT之家了解,“小饿”具有三大核心能力。语音交互与智能响应:支持语音唤醒,可直接完成接单、确认到店、查询活动等操作,减少手动点击步骤,提升操作
Reddit在搜索栏中引入AI助手,告别繁琐搜索 196 0 随着互联网的发展,搜索引擎似乎变得愈发臃肿,广告和推销内容的增多让用户感到困扰。如今,很多人已经习惯在寻找信息时先选择 “谷歌一下,某某某 Reddit”。这不仅是一种幽默,也反映了人们对 Reddit 这一社区的信赖,因为用户提供的信息往往更为真实和有用。为了解决这一问题,Reddit 在去年的时候推出了 “Reddit Answers” 功能,这是一种结合人工智能的工具,旨在为用户提供更为简洁
Grok 上线语音模式,马斯克修改昵称为“groklon rust” 196 0 IT之家 5 月 5 日消息,Grok 今日官宣,语音模式现已在 Grok 应用程序中推出,适用于所有 iOS 用户以及 Android 上的 SuperGrok 订阅者。或许是为了配合新功能的宣传,马斯克将 X 平台昵称更改为“groklon rust”,头像也进行了修改。IT之家注意到,2 月 20 日,xAI 宣布 Grok 3 免费向公众提供服务(直到服务器不堪重负为止)。在此之前,Gr
AI大模型 AI聊天机器人 生成式AI 推理模型 AI实力排名洗牌:OpenAI、谷歌崛起,Anthropic下滑 196 0 这一转向专业推理能力的趋势表明AI市场正在成熟,基础文本生成功能正逐渐商品化,服务提供商被迫通过高价值能力来实现差异化,以获取溢价收入……Poe最 新的使用报告显示,OpenAI和谷歌在关键AI领域中的地位持续增强,而Anthropic则出现下滑。同时,具备专业推理能力的模型正成为一场关键竞争的焦点。根据今天由Poe发布的数据(Poe是一个AI模型的集成平台),在 2025 年 1 月至 5
商汤SenseCore2.0 大模型 AI基础设施 异构算力 商汤大装置SenseCore 2.0全新升级 推出1亿元代金券计划 196 0 4月14日,在北京举办的2025商汤技术交流日上,商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者,商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务,以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级,旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及
中国移动发布移动爱家 AI 拍摄眼镜与 AI 音频眼镜 196 0 IT之家 4 月 18 日消息,中国移动智慧家庭运营中心 4 月 15 日在第五届中国国际消费品博览会上发布了全新产品“移动爱家 AI 眼镜”。移动爱家 AI 拍摄眼镜与 AI 音频眼镜通过深度融入大模型,可实现智能体视频通话、跨应用联动、辅助教育、协作办公等功能。移动爱家 AI 眼镜号称配备了“三个技能”:“好耳机”:在音质方面,采用双麦 ENC 通话降噪,经过数千次的音频调试,环境噪声抑制能
OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系 196 0 IT之家 4 月 10 日消息,OpenAI 宣布启动 OpenAI 先锋计划(OpenAI Pioneers Program),致力于改善当前 AI 模型的评分方式。该公司认为现有的 AI 基准测试存在缺陷,而该计划将专注于创建能够“设定优秀标准”的评估体系。随着 AI 技术在各行业的应用加速普及,深入了解并提升其在现实世界中的影响力变得至关重要。OpenAI 在其博客中指出,创建特定领域的评
Vidu Q1 系列 API 正式开放 同时上线文生音频模型 196 0 近日, Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机,通过调用 API 体验 Vidu Q1模型所具备的多样化功能。此次开放的 Vidu Q1系列模型在视频生成能力上实现了显著升级。在图生视频方面,它能够依据用户提供的图像,快速生成与之相关且富有创意的视频内容,为图像赋予动态生命力;首尾帧功能则让用户可以精准控制视频的起始与结束画面,使视频呈现更加符合预期的叙事节奏;
苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜? 196 0 感谢IT之家网友 風見暉一 的线索投递!IT之家 4 月 23 日消息,彭博社今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。据知情人士透露,Rockwell 从 Vision Pro 软件团队中引入多位得力干将,替换 Siri 原有领导层。其中 Ranjit Desai 负责包括底
首席执行官皮查伊:谷歌超 30% 代码现由 AI 协助编写 196 0 IT之家 4 月 25 日消息,在 Alphabet 2025 年第一季度财报电话会议上,谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示,公司超过 30% 的代码现由 AI 协助编写。皮查伊表示得益于 AI 模型愈发强大,以及引入 Agentic workflows(智能体工作流),AI 辅助编码在各团队中迅速普及。目前开发者频繁采纳 AI 生成建议,平均每三次代码变更中就有一次
Grok xAI 多模态AI 生成式人工智能 Grok大更新!视觉能力、多语言音频处理与实时搜索功能震撼上线 196 0 由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。这一更新标志着Grok在多模态AI领域的重大突破,为用户提供了更智能、更便捷的交互体验。以下,AIbase将为您详细解析此次更新的亮点与意义。视觉能力突破Grok的视觉处理能力是此次更新的核心亮点之一。尽管早在2024年4月,xAI曾宣
小米推出米家无线洗地机 4 Max:活水贴边清洁臂、23000Pa 吸力,国补价 2549.15 元起 196 0 IT之家 5 月 10 日消息,小米米家无线洗地机 4 Max 现已上架京东平台并开启预约,新品配备活水贴边清洁臂、23000Pa 吸力,5 月 13 日 20:00 开售,首发价 2999 元,国补价 2549.15 元起。IT之家从商品页面获悉,新品采用活水贴边清洁臂专利,滚刷和清洁臂拥有独立的活水清洁系统,贴边清洁时活水持续喷淋浸湿清洁臂及刷头边缘,实时清水清洗边角。红外感应装置搭配智能加
拍照问夸克 夸克AI超级框 阿里巴巴 AI相机 夸克 AI 超级框全新上线 “拍照问夸克” 功能 196 0 阿里巴巴旗下的夸克 AI 超级框正式推出了一项名为 “拍照问夸克” 的全新功能。这一功能的亮点在于,它能够通过 AI 相机识别图像中的人物、物体以及其他细节,进而回答用户在现实生活中的各种问题。这项技术基于先进的视觉理解与推理能力,使得用户不再需要用复杂的语言描述需求,只需简单拍照即可。“拍照问夸克” 功能的应用场景非常广泛。当用户面临复杂的物体、图表或图形时,往往难以用言语表达出自己的需求。这时
清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP 197 0 近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(