在全球科技界备受瞩目的国际计算机视觉大会(ICCV)即将于2025年10月19日至23日在美丽的檀香山召开,苹果公司确认将携带多项重要研究成果亮相这一盛会。此次大会旨在聚焦计算机视觉领域的前沿技术和研究进展,苹果也不例外,将展示他们在多模态模型和视频生成等热点领域的最新研究。
图源备注:图片由AI生成,图片授权服务商Midjourney
苹果公司将提交并展示八篇论文,涵盖多种重要议题。其中,涉及的主题包括 “文本到视频对齐的评估方法”、“多模态大语言模型中的三维空间理解能力”,以及 “可扩展的视频生成方法” 等,展现出苹果在人工智能和计算机视觉领域的深厚实力和创新能力。此外,苹果机器学习应用研究部经理 C. Thomas 博士也将作为主旨演讲者参与大会,分享他对当前技术趋势的见解。
值得注意的是,苹果还将参与 “计算机视觉领域女性研讨会”,强调对女性科技人才的支持与倡导。会议中,苹果的研究人员 Patricia Vitoria Carrera 和 Tanya Glozman 将担任导师,与与会者深入交流经验与见解。
以下是苹果将在2025ICCV 大会上展示的八篇论文题目:
1. ETVA:通过细粒度问题生成与回答实现文本到视频对齐的评估
2. MM-Spatial:探索多模态大语言模型中的三维空间理解能力
3. 原生多模态模型的扩展规律研究
4. 稳定扩散模型在视觉上下文学习中的隐性优势
5. STIV:可扩展的文本与图像条件化视频生成方法
6. UINavBench:交互式数字智能体综合评估框架
7. 基于多模态提示的统一开放世界分割技术
8. UniVG:用于统一图像生成与编辑的通用扩散模型
苹果的参与标志着其在计算机视觉和人工智能领域的持续投入和创新,期待他们在大会上的精彩表现,为未来的科技发展带来新的启示。