豆包AI高考成绩达清北录取线!文科683分领跑国内外顶级模型

豆包AI高考成绩达清北录取线!文科683分领跑国内外顶级模型

4.8
0热度

字节跳动Seed团队近日公布了2025高考全科测试的惊人结果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的优异成绩,达到清华北大录取分数线,在国内外AI模型高考测试中表现抢眼。此次测试采用全国新一卷和山东省自主命题试卷,豆包与谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款国内外顶级AI模型同台竞技。豆包文科成绩683分在参测模型中

字节跳动Seed团队近日公布了2025高考全科测试的惊人结果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的优异成绩,达到清华北大录取分数线,在国内外AI模型高考测试中表现抢眼。

字节跳动抖音豆包大模型

此次测试采用全国新一卷和山东省自主命题试卷,豆包与谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款国内外顶级AI模型同台竞技。豆包文科成绩683分在参测模型中获得最高分,理科成绩648分仅次于谷歌Gemini2.5Pro的655分。在单科表现上,豆包在语文、英语、物理、历史、地理、政治六门学科均获最高分,数学成绩也超过140分,展现出色的逻辑推理能力。

在这场AI"高考大战"中,各模型展现了不同的学科优势。DeepSeek R1获得数学单科最高分145分,Gemini2.5Pro以82分获得化学最高分,OpenAI o3则与Gemini2.5Pro并列生物最高分77分。这种差异化表现反映了不同AI模型在知识结构和推理方式上的特色。

QQ20250626-095943.png

Seed团队发现了一个重要技术细节:首次测试中由于网络版考卷清晰度较低,各大模型在化学、生物等依赖图像的科目中普遍丢分严重。在获得高清版试题图片后,团队采用图文交织方式重新测试,结果显示豆包在化学、生物两科提升近30分,理科总成绩可达676分。这一发现验证了全模态推理对激发模型潜力的重要作用,为AI在视觉理解和跨模态推理方面的发展提供了重要启示。

山东省采用"3+3"高考模式,语数英为基础学科,另选三门科目采用等级赋分制。据当地资深高中教师分析,豆包赋分成绩组合最高可达690分左右,参照2025年山东地区一分一段表,排名约在前80位,成绩足以冲击清华、北大等顶尖学府。这一表现不仅展示了豆包的绝对实力,更体现了其在复杂评分体系下的适应能力。

豆包在高考中的出色表现不仅展示了其强大的知识储备和推理能力,更重要的是验证了多模态AI在复杂认知任务中的巨大潜力。特别是在图文结合的理科题目处理上,豆包展现出的近30分提升幅度,为AI教育应用提供了新的技术路径。这一成绩的取得,标志着国产AI大模型在综合认知能力上已达到国际先进水平,为AI在教育领域的深度应用奠定了坚实基础。

首页 发现
看过 我的