视觉推理能力 - AI中国

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

AI热点 12月前

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

近日，由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V，专门针对多模态大模型的视觉推理能力进行测试。该基准的推出，旨在填补当前评估体系中对模型视觉输出能力的空白，以便更全面地了解现有模型的性能。RBench-V 基准测试包含803道题目，涉及多个领域，包括几何与图论、力学与电磁学、多目标识别和路径规划等。与以往只要求文字回答的评估不同，这次评

AI中国

AI中国

336 0

热门标签

教学用户互动率鬼畜星探企划第二十二期 AI！启动！小蓝牌板栗饼 EvalsAPI 游戏杂谈 coze智能体 Command gemin2.5pro

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

免费AI换脸软件有哪些？6 个免费AI换脸工具和软件推荐

1466 阅读

2

在线克隆人声、文本转语音免费的ai语音生成器有哪些软件？8 款免费中文 AI 合成声音软件推荐

1457 阅读

3

6 款 AI 角色扮演软件推荐，跟虚拟好友一起聊天对话

1443 阅读

4

一键生成PPT软件有哪些？推荐14款国产AI智能生成PPT工具

1388 阅读

5

ai模拟自己声音唱歌，5款精选AI翻唱生成器推荐

1360 阅读

6

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

1337 阅读

7

即梦AI绘画教程，解决AI生成图片人物一致性

1328 阅读

8

如何用免费AI工具让一张人物照片开口说话唱歌？用这个ai工具就能完成

1302 阅读

9

打造你的专属AI Agent：从理论到实践的完全指南

1234 阅读

10

【靠AI变现】Deepseek+SD做大尺度擦边女，详细生涩图接单教学分享！未成年勿学，成年必看来财特快，渠道合规！

1071 阅读

11

用ai就能让古人跳起健身操，即梦AI生成爆款短视频教程

1036 阅读

12

7款免费的AI视频生成工具，助你轻松打造专业影片

958 阅读

13

用豆包做育儿短视频，这个成语故事动画片教程3分钟教会你

934 阅读

14

智能识别图片内容软件有哪些？6款支持AI图片识别工具推荐，可查人脸、动植物、建筑、文字、原图

926 阅读

15

做AI视频，你一定要知道这10款爆火的AI视频工具

918 阅读

16

AI 视频剪辑软件哪个好？9款优秀的AI视频工具推荐

889 阅读

17

速抢（2核2G）77元/年香港免备案服务器

886 阅读

18

人物一致性提示词怎么写？即梦AI视频生成保持人物形象一致的方法

839 阅读

19

免费制作自己的口播3D卡通虚拟数字人，手把手教你用AI做一个数字人教程

830 阅读

20

推荐9款好用的AI换脸工具，用AI换脸一键生成

814 阅读