一致性思维链(SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS)

概要

思维链已经在很多任务上取得了非常显著的效果,这篇论文中提出了一种 self-consistency 的算法,来代替 贪婪解码 算法。本方法通过 采样多个思维链集合,然后LLM模型生成后,选择一个最一致的答案作为最后的结果。一致性思维链 认为复杂的推理问题,有不同的思维方式去解决,从而得到最终唯一答案。经过实验验证,一致性思维链取得了显著的提升。

方法

一致性思维链思想非常经典,我们首先用思维链的方式去prompt模型,然后对于生成的答案,不用贪婪解码的方式,而是让模型生成一个多样性的推理过程和答案,然后投票选择答案一致性最高的那个结果。一致性思维链非常类似于人类的思维,如果有多种思维的方式能够获得相同的答案,那么这个答案正确的概率最大。一致性思维链解决了思维链重复性和局部性的问题,同时一定程度上解决了思维链随机性的问题。

一致性思维链在大部分推理问题上取得了非常显著的效果。

相关推荐
前端拿破轮11 分钟前
利用Github Page + Hexo 搭建专属的个人网站(一)
前端·人工智能·后端
万岳科技程序员小金33 分钟前
AI数字人小程序源码开发全流程实战:前端交互+后端算法部署指南
前端·人工智能·软件开发·ai数字人小程序·ai数字人系统源码·ai数字人软件开发·ai数字人平台搭建
励ℳ34 分钟前
机器学习-LASSO算法指南
人工智能·算法·机器学习
小刘的大模型笔记35 分钟前
大模型微调PPO原理——零基础吃透RLHF核心算法
人工智能
IT_Octopus41 分钟前
AI 工程 生产级别向量数据库Milvus2.6.10性能测试报告
数据库·人工智能·milvus
rainbow72424442 分钟前
主流AI证书全面对比
人工智能
Hcoco_me44 分钟前
深度学习目标关联:常见深度学习匹配方法全面详解
人工智能·深度学习·分类·数据挖掘·自动驾驶
EF@蛐蛐堂44 分钟前
【AI】openclaw 小龙虾料理全攻略
人工智能
美酒没故事°1 小时前
AI中的agent、skill、mcp都是什么?
人工智能·ai
后端小肥肠1 小时前
从n8n到Claude Skills:轻松搞定小红书热门美食手账,3分钟出图,小白也能会!
人工智能·aigc·agent