Midjourney操作界面

大白话秒懂五论文—AI大模型思维链的进化揭秘⓹ 自我进化

4.8
0热度

往期回顾大白话秒懂五论文—AI大模型思维链的进化揭秘⓵手把手教大白话秒懂五论文—AI大模型思维链的进化揭秘⓶咒语觉醒大白话秒懂五论文—AI大模型思维链的进化揭秘⓷双剑合璧大白话秒懂五论文—AI大模型思维链的进化揭秘⓸群体智慧⓹ 自我进化(Self Improvement)彬老师:是的,论文《LARGE LANGUAGE MODELS CAN SELF-IM

往期回顾

大白话秒懂五论文—AI大模型思维链的进化揭秘⓵手把手教

大白话秒懂五论文—AI大模型思维链的进化揭秘⓶咒语觉醒

大白话秒懂五论文—AI大模型思维链的进化揭秘⓷双剑合璧

大白话秒懂五论文—AI大模型思维链的进化揭秘⓸群体智慧


⓹ 自我进化(Self Improvement)

彬老师:是的,论文 《LARGE LANGUAGE MODELS CAN SELF-IMPROVE》可以回答大饼的疑问,该论文探索了如何让模型在训练过程中自己产生并优化思维链能力。

弘老师:这项研究的核心思想是" 自举"(bootstrapping)——让模型从自己生成的高质量思维链中学习。

小渣:这听起来有点像"自学成才"?

弘老师:是的,具体过程是这样的:1. 给模型提供一些人工设计的CoT示例;2. 利用Self-Consistency方法让模型针对新问题生成多种思维链和答案;3. 通过多数投票选出最可能正确的答案和对应的思维链;4. 将这些高质量的"问题-思维链-答案"组合成新训练数据;5. 用这些数据进一步训练(fine-tuning)模型。如下图所示。

小渣:这意味着我们不需要大量人工标注的思维链数据,模型可以自己产生这些训练数据?

彬老师:正是如此,这大大降低了对人工标注的依赖,为模型自主学习复杂推理能力开辟了新途径。

大饼:如果不断重复这个过程,模型的推理能力是不是可以无限提升?

弘老师:只是如此简单重复,还是有上限的。不过,提升大模型推理能力的手段还有许许多多,远不止今天探讨的这几篇思维链相关的论文,推理能力的爆发才刚刚开始。未来,像 Jason Wei这样的做出杰出贡献的人工智能科学家会越来越多,未来可期!

Jason Wei:各位兄弟抬举我Jason Wei了, 亿点点心意,聊表谢意。所有看到 《CoT五论文解读—AI大模型思维链的进化揭秘与实践》的人,你们一定 发大财!

彬老师:谢谢Jason Wei!咱们做个小小的总结吧,如下图所示。此外本次探讨的很多内容是非常实用落地的,希望读者能好好的去学习体会。今天就交流到这里,咱们下次再聊。





公众号:收获不止数据库

微信:ljbyxl1213

系列回顾

  • “大白话人工智能” 系列

  • “数据库拍案惊奇” 系列

  • “世事洞明皆学问” 系列


    来自 “ ITPUB博客 ” ,链接:https://blog.itpub.net/9091385/viewspace-3079662/ ,如需转载,请注明出处,否则将追究法律责任。

    点赞(0)

    评论列表 共有 0 条评论

    暂无评论
    发表
    评论
    顶部