全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

KEEP颠覆视频人脸超分辨率！全新SOTA模型融合卡尔曼滤波，细节与时序一致性完美突破！

Hugging Face社区发布了一项突破性技术——KEEP（Kalman-inspired Feature Propagation），一款专为视频人脸超分辨率设计的新模型，被誉为该领域的全新SOTA(State-of-the-Art)。通过创新的卡尔曼滤波灵感架构和跨帧注意力机制，KEEP在恢复人脸细节和保持时序一致性方面实现了显著突破，超越传统方法。AIbase综合最新动态，深入解析KEEP的

全新音频问答模型 Omni-R1：利用文本驱动的强化学习和自动生成的数据推进音频问答

最近，一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。该模型在 Qwen2.5-Omni 的基础上，通过一种名为 GRPO（Group Relative Policy Optimization）的强化学习方法进行优化，显示出在音频问答任务中的出色表现。Omni-R1在著名的 MMAU 基准测试中创造了新的最先进成绩，涵盖了声

谷歌Gemini网页版对话搜索全面上线，移动端逐步推出，重塑AI搜索新体验

谷歌宣布正式向全球所有用户推出Gemini网页版对话搜索功能，标志着其基于Gemini2.5的AI搜索体验进入全面普及阶段。这一功能允许用户通过自然语言进行多轮对话式搜索，取代传统关键词查询，提供更智能、直观的答案。谷歌同时透露，移动端对话搜索功能也将逐步上线，进一步扩展Gemini的覆盖范围。AIbase综合最新动态，深入解析这一功能的技术亮点及其对全球搜索生态的深远影响。对话搜索:从关键词到自