豆包AI高考成绩达清北录取线！文科683分领跑国内外顶级模型

AIbase基地

发布了 11569 文章

字节跳动Seed团队近日公布了2025高考全科测试的惊人结果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的优异成绩，达到清华北大录取分数线，在国内外AI模型高考测试中表现抢眼。

此次测试采用全国新一卷和山东省自主命题试卷，豆包与谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款国内外顶级AI模型同台竞技。豆包文科成绩683分在参测模型中获得最高分，理科成绩648分仅次于谷歌Gemini2.5Pro的655分。在单科表现上，豆包在语文、英语、物理、历史、地理、政治六门学科均获最高分，数学成绩也超过140分，展现出色的逻辑推理能力。

在这场AI"高考大战"中，各模型展现了不同的学科优势。DeepSeek R1获得数学单科最高分145分，Gemini2.5Pro以82分获得化学最高分，OpenAI o3则与Gemini2.5Pro并列生物最高分77分。这种差异化表现反映了不同AI模型在知识结构和推理方式上的特色。

Seed团队发现了一个重要技术细节:首次测试中由于网络版考卷清晰度较低，各大模型在化学、生物等依赖图像的科目中普遍丢分严重。在获得高清版试题图片后，团队采用图文交织方式重新测试，结果显示豆包在化学、生物两科提升近30分，理科总成绩可达676分。这一发现验证了全模态推理对激发模型潜力的重要作用，为AI在视觉理解和跨模态推理方面的发展提供了重要启示。

山东省采用"3+3"高考模式，语数英为基础学科，另选三门科目采用等级赋分制。据当地资深高中教师分析，豆包赋分成绩组合最高可达690分左右，参照2025年山东地区一分一段表，排名约在前80位，成绩足以冲击清华、北大等顶尖学府。这一表现不仅展示了豆包的绝对实力，更体现了其在复杂评分体系下的适应能力。

豆包在高考中的出色表现不仅展示了其强大的知识储备和推理能力，更重要的是验证了多模态AI在复杂认知任务中的巨大潜力。特别是在图文结合的理科题目处理上，豆包展现出的近30分提升幅度，为AI教育应用提供了新的技术路径。这一成绩的取得，标志着国产AI大模型在综合认知能力上已达到国际先进水平，为AI在教育领域的深度应用奠定了坚实基础。