一致性思维链(SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS)

概要

思维链已经在很多任务上取得了非常显著的效果,这篇论文中提出了一种 self-consistency 的算法,来代替 贪婪解码 算法。本方法通过 采样多个思维链集合,然后LLM模型生成后,选择一个最一致的答案作为最后的结果。一致性思维链 认为复杂的推理问题,有不同的思维方式去解决,从而得到最终唯一答案。经过实验验证,一致性思维链取得了显著的提升。

方法

一致性思维链思想非常经典,我们首先用思维链的方式去prompt模型,然后对于生成的答案,不用贪婪解码的方式,而是让模型生成一个多样性的推理过程和答案,然后投票选择答案一致性最高的那个结果。一致性思维链非常类似于人类的思维,如果有多种思维的方式能够获得相同的答案,那么这个答案正确的概率最大。一致性思维链解决了思维链重复性和局部性的问题,同时一定程度上解决了思维链随机性的问题。

一致性思维链在大部分推理问题上取得了非常显著的效果。

相关推荐
三块可乐两块冰2 分钟前
【第二十六周】机器学习笔记二十五
人工智能·笔记·机器学习
一招定胜负5 分钟前
opencv图片处理常见操作
人工智能·opencv·计算机视觉
byzh_rc5 分钟前
[机器学习-从入门到入土] 特征选择
人工智能·机器学习
Hcoco_me6 分钟前
大模型面试题41:RoPE改进的核心目标与常见方法
开发语言·人工智能·深度学习·自然语言处理·transformer·word2vec
Toky丶7 分钟前
【文献阅读】Half-Quadratic Quantization of Large Machine Learning Models
人工智能·机器学习
海棠AI实验室7 分钟前
海光DCU部署全攻略:开箱、配置到AI训练的最佳实践|2026工程化版本
人工智能·dcu·海光
LDG_AGI9 分钟前
【推荐系统】深度学习训练框架(二十三):TorchRec端到端超大规模模型分布式训练+推理实战
人工智能·分布式·深度学习·机器学习·数据挖掘·推荐算法
沛沛老爹12 分钟前
Web开发者快速上手AI Agent:基于Function Calling的提示词应用优化实战
java·人工智能·llm·agent·web·企业开发·function
张彦峰ZYF13 分钟前
提示词工程(Prompt Engineering):核心技巧进阶与工程化流程
人工智能·prompt·提示词工程·用清晰明确的话语表达任务意图·在可能情况下用示例去阐明输出·根据任务类型灵活选择提示策略·提示设计视作迭代工程非单次输入
AI浩13 分钟前
ARConv:用于遥感全色锐化的自适应矩形卷积
人工智能·目标跟踪