一致性思维链(SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS)

概要

思维链已经在很多任务上取得了非常显著的效果,这篇论文中提出了一种 self-consistency 的算法,来代替 贪婪解码 算法。本方法通过 采样多个思维链集合,然后LLM模型生成后,选择一个最一致的答案作为最后的结果。一致性思维链 认为复杂的推理问题,有不同的思维方式去解决,从而得到最终唯一答案。经过实验验证,一致性思维链取得了显著的提升。

方法

一致性思维链思想非常经典,我们首先用思维链的方式去prompt模型,然后对于生成的答案,不用贪婪解码的方式,而是让模型生成一个多样性的推理过程和答案,然后投票选择答案一致性最高的那个结果。一致性思维链非常类似于人类的思维,如果有多种思维的方式能够获得相同的答案,那么这个答案正确的概率最大。一致性思维链解决了思维链重复性和局部性的问题,同时一定程度上解决了思维链随机性的问题。

一致性思维链在大部分推理问题上取得了非常显著的效果。

相关推荐
nudt_qxx15 小时前
讲透Transformer(三):Transformer 注意力机制详解与Qwen/DeepSeek近期改进
人工智能·深度学习·transformer
绒绒毛毛雨15 小时前
多目标强化学习-英伟达:GDPO
人工智能·深度学习·机器学习
systeminof15 小时前
亚马逊转向自研路线,AI生态控制权之争升温
人工智能
Ray Liang15 小时前
EvoMap 硬刚 OpenClaw!从基因胶囊到仿生大脑,AI 的尽头果然是生物学
人工智能·ai助手·openclaw·mindx
说实话起个名字真难啊15 小时前
彻底解决openclaw的tokens焦虑
人工智能·ai·openclaw
新缸中之脑15 小时前
从零实现AI代理的长期记忆
数据库·人工智能
摸鱼仙人~15 小时前
0-1背包与完全背包:遍历顺序背后的秘密
人工智能·算法
AC赳赳老秦16 小时前
文旅AI趋势:DeepSeek赋能客流数据,驱动2026智慧文旅规模化跃迁
人工智能·python·mysql·安全·架构·prometheus·deepseek
systeminof16 小时前
AI作曲进入一句话时代:谷歌Gemini推出音乐模型
人工智能
量子-Alex16 小时前
【大模型思维链】RAP-MCTS算法详解
人工智能