一致性思维链(SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS)

概要

思维链已经在很多任务上取得了非常显著的效果,这篇论文中提出了一种 self-consistency 的算法,来代替 贪婪解码 算法。本方法通过 采样多个思维链集合,然后LLM模型生成后,选择一个最一致的答案作为最后的结果。一致性思维链 认为复杂的推理问题,有不同的思维方式去解决,从而得到最终唯一答案。经过实验验证,一致性思维链取得了显著的提升。

方法

一致性思维链思想非常经典,我们首先用思维链的方式去prompt模型,然后对于生成的答案,不用贪婪解码的方式,而是让模型生成一个多样性的推理过程和答案,然后投票选择答案一致性最高的那个结果。一致性思维链非常类似于人类的思维,如果有多种思维的方式能够获得相同的答案,那么这个答案正确的概率最大。一致性思维链解决了思维链重复性和局部性的问题,同时一定程度上解决了思维链随机性的问题。

一致性思维链在大部分推理问题上取得了非常显著的效果。

相关推荐
bryant_meng3 分钟前
【Reading Notes】(4)Favorite Articles from 2021
人工智能·深度学习·业界资讯
雷工笔记7 分钟前
MES / WMS / AGV 交互时序图及生产管理模块界面设计清单
人工智能·笔记
海兰7 分钟前
使用 Spring AI 打造企业级 RAG 知识库第二部分:AI 实战
java·人工智能·spring
清空mega9 分钟前
动手学深度学习——多尺度锚框
人工智能·深度学习·目标跟踪
pzx_00113 分钟前
【优化器】 随机梯度下降 SGD 详解
人工智能·python·算法
波动几何17 分钟前
风格设计技能Style Design Generator
人工智能
AEIC学术交流中心18 分钟前
【快速EI检索 | SPIE出版】第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议(CWMC&AIBDE 2026)
大数据·人工智能·量子计算
永霖光电_UVLED21 分钟前
2 μm 波段 PCSEL 激光振荡实现
人工智能
2501_9481142430 分钟前
技术解码:Gemini交互式模拟API与高负载网关的选型逻辑
人工智能·python·ai