阶跃星辰发布并开源音乐大模型——音跃ACE-Step 121 0 阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。ACE Studio是一家以生成式AI技术为核心的科技公司,其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品,用户遍布全球,包括格莱美获奖者
巨头砸钱、码农通宵!为何技术大佬集体高潮的MCP 普通人却无感? 81 0 最近几个月,AI 圈突然被MCP刷屏了。这个由 Anthropic 在2024年底推出的模型上下文协议(Model Context Protocol),被称为 "AI 世界的 USB-C 接口"。简单来说,它就像一个万能插座,让大模型能轻松连接外部工具、数据库甚至物理设备,实现从 "动口" 到 "动手" 的跨越。图源备注:图片由AI生成技术圈对 MCP 的追捧已经到了疯狂的程度:巨头扎堆:Open
清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP 193 0 近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(
Google 高管证实:数据 “偏袒” 自家 AI,拒绝竞品获取搜索数据 122 0 在一场备受关注的法庭听证会上,Google 搜索业务负责人利兹・里德(Liz Reed)向外界揭示了公司对待人工智能(AI)模型数据请求的态度。她明确表示,尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道,但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini,这一证词为反垄断监管机构的调查提供了重要支持。近年来,美国司法部对 Google 的反垄断调查持续升温,要求
消息称通义视觉负责人薄列峰离职 或加入某大厂新组建多模态团队 144 0 据多方信源透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于2024年4月30日正式离职,并低调加盟某头部互联网公司,出任新设立的多模态模型部副总经理一职。尽管该互联网公司具体名称尚未公开,坊间普遍猜测其去向可能是字节跳动或腾讯,但目前相关公司及本人均未作出回应,尚无法证实具体归属。图源备注:图片由AI生成,图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“
新兴混合 AI 模型 CausVid:几秒钟内生成高质量视频 73 0 近日,麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发的创新性 AI 模型 CausVid 引起了广泛关注。这一混合模型可以在几秒钟内生成高质量视频,标志着视频创作领域的一次重大技术突破。 创新的技术架构CausVid 的设计理念颠覆了传统的视频生成方式。许多现有的 AI 视频生成模型通常采用逐帧生成的方式,效率较低,且质量容易下降。而 CausVid
NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色 201 0 NBC 近日宣布,将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。Fagan 于2017年去世,他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。NBC 计划在10月份重新播出 NBA 比赛时,将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。图源备注:图片由AI生成,图片授权服务商MidjourneyF
微软推出三大 AI 新功能,提升 Windows 11 使用体验 84 0 在5月6日的最新发布会上,微软宣布了一系列新的 AI 功能,旨在提升 Windows11用户的使用体验。这些功能将在 Copilot+ PC 上首发,并逐步推向所有 Windows11用户。微软引入了一款 AI 代理,帮助用户更便捷地修改 Windows 设置。用户可以直接通过语音或文字向代理说明需求,比如调整鼠标指针或通过语音控制 Windows,代理将理解用户的请求并执行相应任务,但需要用户的
减肥人士的AI搭子来了!支付宝AI健康管家推出“减重专区” 69 0 减重人士有了专属的“AI搭子”!5月7日,支付宝AI健康管家正式上线“减重专区”,推出系列智能体指导用户科学饮食、健康锻炼,此外,还有7位三甲医院多科室减重医生在专区内开设了AI分身,助力全民体重管理。目前,用户上支付宝搜“AI健康管家”,点击“服务”即可体验。支付宝AI健康管家-减重专区在专区内,用户可以通过“饮食健康小助手“拍下日常饮食照片,交由AI识别热量并记录,智能体还能根据用户个人情况生
ComfyUI品牌焕新升级,推出原生API节点 114 0 ComfyUI于2025年5月6日宣布完成品牌升级,同步推出原生API节点功能。这一更新不仅为ComfyUI带来了全新的视觉标识,还通过集成11个主流在线视觉AI模型、65个新节点,显著提升了其图像和视频生成能力。据官方介绍,用户无需自行申请API密钥,仅需在ComfyUI平台登录即可无缝调用包括Flux.1、Veo2、GPT-Image-1等在内的先进模型。原生API节点:一站式接入主流模型Co
Cursor宣布免费向学生开放一年Pro会员,助力AI编程教育 123 0 AI编程助手Cursor于2025年5月6日宣布了一项重磅举措:即日起向全球学生免费开放为期一年的Cursor Pro会员。这一福利旨在降低学生使用AI编程工具的门槛,助力编程教育与技术创新。Cursor的免费政策覆盖包括中国在内的多个国家,学生只需通过教育邮箱和SheerID验证身份,即可享受价值192美元的Pro会员服务。核心优势:全面解锁AI编程潜能Cursor是一款基于Visual Stu
马斯克律师指责 OpenAI 重组为 “透明的借口” 129 0 OpenAI 近期对其计划中的营利性重组进行了一些调整,但这并没有改变埃隆・马斯克的立场。马斯克的律师马克・托伯夫(Marc Toberoff)表示,这些调整只是一个 “透明的借口”,并未解决外界对 OpenAI 的非营利资产仍被用于私利的担忧,尤其是对萨姆・阿尔特曼(Sam Altman)、投资者和微软等个人和实体的利益。马斯克曾试图通过法律手段阻止 OpenAI 的重组,并提出以974亿美元的
思科与 Meta 携手推出网络安全新武器:Foundation-sec-8B 大模型 171 0 思科(Cisco)与 Meta 的合作为我们带来了一个令人振奋的新进展。他们共同发布了名为 Foundation-sec-8B 的开源大型语言模型(LLM),该模型专门针对网络安全领域,具有80亿个参数。这一创新产品不仅展现了两大科技巨头的强强联手,也预示着网络安全技术的新纪元。Foundation-sec-8B 模型基于 Meta 最新的 Llama3.1架构,由思科新成立的研发团队开发。团队在
小米米家冰箱 Pro 双系统法式平嵌 508L 新增星锻银配色,国补价 3999 元起 171 0 感谢IT之家网友 風見暉一 的线索投递!IT之家 5 月 8 日消息,小米于上个月推出米家冰箱 Pro 双系统法式平嵌 508L(冰晶白),售价 4999 元,国补价 3999 元起。这款产品现新增一款星锻银配色(玻璃面板)并开启预约,价格保持不变,5 月 16 日 20:00 开售。IT之家附商品信息如下:据官方介绍,这款新品的冷藏、冷冻各搭载独立蒸发器、风机。风路独立循环,冷冻和冷藏互不干
亚马逊推出能“感知”触碰的机器人,可与仓库工人协同作业 73 0 IT之家 5 月 7 日消息,亚马逊宣布推出一款名为 Vulcan 的新型仓储机器人,该机器人配备先进的人工智能技术,并具备触觉功能,能够完成公司仓库中约四分之三的物品拣选与存放任务,而这些工作此前主要由人工完成。“Vulcan 代表了机器人技术的一大突破。”亚马逊应用科学总监亚伦・帕内斯(Aaron Parness)在新闻稿中表示,“它不仅能够感知世界,还能感知触摸,从而实现亚马逊机器人此前无
iOS 版谷歌 App“简化”功能上线:AI 一键帮你读懂复杂内容、专业术语 89 0 感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 5 月 7 日消息,谷歌今日面向 iOS 版 App 发布了一项全新 AI 功能“Simplify(简化)”,旨在帮助 iPhone 用户更轻松地理解网上专业性强或晦涩难懂的内容。用户只需选中对应的文字,即可在当前网页上生成更通俗易懂的版本,无需跳转页面。据IT之家了解,Simplify 依托谷歌 Gemini AI 模型,由 Google