合成数据立功!AccVideo实现高质量视频生成、速度飙升8. 5倍、 11 0 在人工智能视频生成领域,扩散模型以其卓越的性能备受瞩目。然而,其固有的迭代去噪特性导致生成过程耗时且计算成本高昂,成为制约其广泛应用的关键瓶颈。近日,来自B北京航空大学、香港大学和上海人工智能实验室的研究团队联合发布了一项名为 AccVideo 的创新技术。该方法通过一种新颖高效的蒸馏方法,并结合合成数据集,成功将视频扩散模型的生成速度提升了惊人的8.5倍。现有的视频扩散模型在生成高质量视频方面表
亚马逊 Alexa 基金扩展投资范围,青睐人工智能初创企业 11 0 亚马逊于2015年成立了 Alexa 基金,最初旨在支持早期语音技术初创企业。随着大型语言模型的崛起以及亚马逊推出基于生成性人工智能的 Alexa+,该基金决定扩展投资范围,更多地关注人工智能初创企业。Alexa 基金负责人保罗・伯纳德表示,随着人工智能的迅速发展,基金的使命已经超越了最初的语音技术,开始投资包括人工智能硬件和智能助手等多个领域。伯纳德指出:“虽然 Alexa 基金的使命已经随着时
人工智能安全与应用迎来新规范,市场监管总局加快标准研制 11 0 在今天的例行发布会上,市场监管总局宣布,将加快推进人工智能(AI)领域国家标准的研制工作。这一举措旨在引领行业发展方向,优化技术应用,提升产业生态,推动AI技术的高效、可靠应用。首先,市场监管总局将重点关注算力平台的标准建设。计划加快推动深度学习编译器、高质量数据集以及计算调度与协同等关键技术标准的制定。通过优化AI数据服务和计算资源整合,提升人工智能领域的资源利用效率。图源备注:图片由AI生成,
Nvidia 推出 G-Assist:本地运行的 AI 助手为玩家提供全方位支持 11 0 Nvidia 最近发布了其实验性 AI 助手 Project G-Assist,该工具可以在 GeForce RTX 卡上本地运行。这一发布是在2024年 Computex 展会上的首次预览后进行的标志着科技公司在为玩家开发专用 AI 助手方面迈出了重要一步。例如微软也在开发一款名为 “Gaming C o p i l o t” 的助手,最初将提供游戏技巧的聊天支持,并计划在后续更新中实时分析游戏
豆包全新 “边想边搜” 功能上线,提升思考与搜索的结合体验 11 0 最近,字节跳动旗下的 AI 助手豆包进行了功能升级,推出了全新的 “深度思考” 模式,现已开始小范围测试。这一模式的创新之处在于将思维推理与信息搜索相结合,用户在使用时可以边想边搜”,从而更全面地获取信息。传统的 AI 搜索往往是先进行全面的信息搜索,再根据结果进行思考。然而,面对复杂问题,单一的搜索方式难以全面涵盖所有相关因素。例如,在购买决策、行业分析或学术研究等场景中,用户通常需要整合多维度
英国政府计划将 AI 引入各行各业,老旧 IT 系统与安全风险成最大障碍 11 0 IT之家 3 月 28 日消息,据外媒 TechRadar 今日报道,英国公共财政监督机构发布报告称,指出人工智能推广面临多重障碍,包括过时的传统 IT 系统、数据质量不佳和数据共享受限等问题。这份报告是英国政府“全面推广 AI”计划的一部分,该计划希望通过吸引 140 亿英镑(IT之家注:现汇率约合 1316.41 亿元人民币)的私营投资,将人工智能技术引入各行各业。公共账目委员会估算,英国中
腾讯元宝更新,能读懂 36 种文件 11 0 IT之家 3 月 28 日消息,腾讯元宝宣布更新,支持用户上传和解析多达 36 种格式的文件。除了 Word、Excel、PPT、PDF 等常见办公文档,还支持.py、.java、.json 等数十种开发文件格式。在开发场景,只要上传文件,元宝即可识别其中的内容,并按照用户的要求完成代码解读、代码审查、定位 Bug、提供修改建议、优化语法,还可以将代码转换成另一种语言。例如,开发者可以直接上传项
研究揭示:“不完美”的 AI 美食图片会让人感到不适 11 0 IT之家 3 月 27 日消息,一项新研究揭示了为何人工智能(AI)生成的食品图片有时会令人感到不安,这给该技术在广告领域取代传统食品摄影的前景带来了疑问。近年来,人工智能在生成逼真图像方面取得了巨大进步,其中也包括食品图片。然而,尽管部分 AI 生成的食品图像看起来足以以假乱真、令人垂涎欲滴,但另一些图像却常常让观看者感到奇怪、不适甚至反感。据医疗新闻网站 News Medical 报道,一项
Anthropic 取得 AI 版权官司初步胜利,出版商被指要求过于宽泛 10 0 IT之家 3 月 26 日消息,AI 公司 Anthropic 在与多家音乐出版商的版权纠纷中取得了初步的法律胜利。美国联邦法官拒绝颁布初步禁令,该禁令原本将限制 Anthropic 使用受版权保护的歌词进行人工智能训练。据路透社报道,美国地区法官 Eumi Lee 裁定,环球音乐集团(UMG)、Concord 和 ABKCO 的请求过于宽泛,并且这些出版商未能证明 Anthropic 使用歌词
OpenAI 计划建设数据中心 或将成全球最大存储客户之一 10 0 近日,有消息称,人工智能公司 OpenAI 正在考虑建设其首个数据中心。这一消息源自《The Information》网站,知情人士透露,OpenAI 高管正在探讨这一项目的可行性。若计划得以落实,OpenAI 将会成为全球最大的存储客户之一,预计其将采购价值数十亿美元的硬件和软件。图源备注:图片由AI生成,图片授权服务商Midjourney根据知情人士的介绍,OpenAI 希望在新数据中心内实现
英伟达或将收购 Lepton AI,进军服务器租赁市场 10 0 近日,有消息称,全球半导体巨头英伟达(Nvidia)正在接近收购初创公司 Lepton AI 的交易,交易金额可能达到数亿美元。Lepton AI 成立于两年前,专注于租赁使用英伟达 AI 芯片的服务器,并将这些服务器租赁给其他企业。根据《信息》(The Information)网站的报道,这笔交易正在紧锣密鼓地进行中,尽管英伟达方面尚未对此进行正式回应。Lepton AI 在2023年5月完成了
宜家或将推出 Matter-over-Thread 智能按钮 Bilresa 10 0 最新消息显示,宜家可能正在积极拓展其智能家居产品线,并拥抱最新的Matter连接标准。据homewithapple报道,一张疑似为宜家未发布的 Bilresa Dual Button 的产品图片被曝光。这款智能开关配备两个可独立编程的按键,引人注目的是,早期信息显示其将采用Thread协议,而非当前主流的Matter智能家居标准。长期以来,宜家的大部分智能家居产品都依赖Zigbee协议,并通过其已
阿里巴巴发布首个全模态大模型 Qwen2.5-Omni,挑战全球科技巨头 10 0 3月27日,阿里巴巴在凌晨时分隆重推出了其首个全模态大模型 —— 通义千问 Qwen2.5-Omni-7B。这款模型具有强大的功能,能够同时处理文本图像、音频和视频等多种输入方式,并且可以实时生成文本与自然语音输出。这一创新的技术突破,标志着阿里在人工智能领域的又一次进步。在权威的多模态融合任务 OmniBench 的评测中,Qwen2.5-Omni 取得了令人瞩目的成绩,刷新了行业纪录,全面超越
国家智慧教育平台2.0智能版上线,增加AI搜索、AI视频总结等功能 10 0 教育部召开了国家教育数字化战略行动2025年的部署会,正式发布了国家智慧教育平台2.0智能版的上线。这一新平台的推出,标志着我国在教育数字化和智能化方面又迈出了重要一步。国家智慧教育平台2.0引入了多项智能化功能,旨在提升学习效率与质量。首先,平台推出了 “白泽智慧学伴” 功能,能够针对性地解决学习者在学习过程中遇到的问题,并根据个人的学习进度与兴趣,推荐适合的课程,从而帮助用户更好地掌握知识。其
开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏 10 0 近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。这一创新的设计让 YuE 在音乐生成的质量上达到了前所未有的高度,甚至与市场上
蚂蚁数科CTO王维:可信智能体是产业AI规模化落地"必选项" 10 0 “在产业化场景中,任何一个小错误都可能导致巨大的损失。因此,通过可信技术搭建可靠、可控、可优化的智能体应用,将会成为产业规模化应用AI必需的基础设施。”在3月28日中关村论坛“未来产业创新发展论坛”上,蚂蚁数科CTO王维表示。王维认为,随着智能体时代的到来,企业服务产品的底层逻辑即将发生根本性改变。企业需要的产品正从工具属性的SaaS(Software-as-a-Service软件即服务)快速走向