标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
全球人工智能信息服务
自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后,如何让大模型掌握这种并行探索多种推理路径的能力,成为了学界关注的焦点。然而,现有方法多依赖于监督微调(SFT),模型一来只能模仿预先构造的 parallel thinking 数据,难以泛化到真实的复杂任务中,其次这种方式对数据要求很高,往往需要复杂的 data pipeline 来构造。为解决这些难题,来自腾讯 AI L
11569 文章 95.03万 关注
1478 文章 0 关注
1221 文章 5.64K 关注
1201 文章 5.87万 关注
1093 文章 9.63万 关注
1017 文章 5.63K 关注