Maverick

首页

Maverick

列表

默认

浏览次数

发布日期

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick，该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而，多位AI研究人员很快发现，Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。Meta在公告中承认，LM Arena上的Maverick是一个"实验性聊天版本"。与此同时，Llama官方

AI热点 2周前 0 点赞 0 评论 144 浏览

Meta Llama4强势登场，却在长上下文任务中翻车

一项新的独立评估显示，Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色，但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”，Maverick 得分49分，领先 Claude3.7Sonnet（得分未具体列出），但落后于 Deepseek V30324(53分);Scout 得分36分，与 GPT-4o-mini 相当，优于 Claude3

AI热点 2周前 0 点赞 0 评论 184 浏览

Maverick 首页 Maverick

列表 默认 浏览次数 发布日期

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta Llama4强势登场，却在长上下文任务中翻车

Maverick

首页

Maverick

列表

默认

浏览次数

发布日期