图像理解

生成很强,推理很弱:GPT-4o的视觉短板

声明:本文来自微信公众号“大数据文摘”(ID:BigDataDigest),作者:文摘菌,授权站长之家转载发布。如果让AI画一只狗站在“左边”,但事先告诉它“左就是右”,你觉得它能反应过来吗?最近,UCLA的一项新研究用一系列精心设计的实验,揭开了GPT-4o在图像理解和推理上的短板——它画得漂亮,却未必真懂你的意思。论文主线很直接,GPT-4o的画图能力确实惊艳,但真正涉及理解图像、语境推理