Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭
Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。Meta在公告中承认,LM Arena上的Maverick是一个"实验性聊天版本"。与此同时,Llama官方