标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
9.84K
粉丝
507
文章
7.71万
总浏览
5
平均评分
AI领域资深专家
Gemini 2.5 Pro拔得头筹,大模型挑战IMO 2025的成绩出炉了!经过人工评判,Gemini以超30%的总成绩断崖式领先,超出第二名89%。o3和o4-mini则位列第二、三名,Grok 4得分只有11.9,但成本比Gemini还高出了22%。还有网友想到了之前拿下IMO银牌的AlphaProof,好奇如果让它来挑战结果会怎样。下面就来了解下这场测试的详细情况~统一环境