【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

解决问题

探索大语言模型解决推理问题的能力。从头训练或微调模型,需要创建大量的高质量含中间步骤的数据集,成本过大。

相关工作

1、使用中间步骤来解决推理问题

(1)使用自然语言通过一系列中间步骤解决数学应用题

(2)通过创建更大的数据集微调语言模型,而不是从头训练

(3)使用语言模型一行一行的预测中间结果预测最终输出

2、采用提示方式

(1)少样本提示

(2)自动学习提示

(3)描述任务的模型指令

本文采用一系列思维来增强语言模型的输出

创新方法

采用由自然语言描述逻辑推理过程 ,构建成一条解决问题步骤的思维链,以Prompt的形式进行few-shot提示。

可采用COT的条件

COT对满足以下三个条件的任务会有帮助:

(1)需要完成具有挑战性的多步推理任务

(2)需要用到大语言模型

(3)缩放曲线相对平滑

缺少上述任意一个条件,都可能会影响性能。

优势

(1)可将问题拆解为多个步骤解决

(2)提供可解释性,便于调试

(3)应用任务领域广

(4)加入少量示例就可以引出COT

(5)few-shot中示例不需要与测试示例来自同一个样本分布

(6)示例顺序对性能影响较小,具有一定的鲁棒性

(7)最开始增加样例数量时候,对性能提升有帮助,达到一定数量后继续增加样例数量对性能改善较小

结论

我们探索了思维链提示作为一个简单且广泛适用的方法来增强语言模型的推理。通过算术推理、符号推理和常识推理的实验,我们发现思维链推理是模型尺度的一种新特性,它允许足够大的语言模型执行原本为平坦尺度曲线的推理任务。扩大语言模型可以执行的推理任务的范围将有望激发基于语言推理方法的进一步工作。

相关推荐
老吴学AI1 分钟前
系列报告十:(Menlo)《2025: The State of Generative AI in the Enterprise》
人工智能·vibe coding
AI即插即用1 分钟前
超分辨率重建 | CVPR 2024 DarkIR:轻量级低光照图像增强与去模糊模型(代码实践)
图像处理·人工智能·深度学习·神经网络·计算机视觉·超分辨率重建
喜欢吃豆5 分钟前
深度解析:FFmpeg 远程流式解复用原理与工程实践
人工智能·架构·ffmpeg·大模型·音视频·多模态
ChaITSimpleLove8 分钟前
AI时代编程范式:“游击战”与“阵地战”的灵活应用
人工智能·ai编程范式·战略思维·战术思维·灵活策略·游击战与阵地战
hacker7078 分钟前
精进Excel图表:AI赋能,成为Excel图表高手
人工智能·信息可视化·excel
OpenBayes10 分钟前
HY-MT1.5-1.8B 支持多语言神经机器翻译;Med-Banana-50K 提供医学影像编辑基准数据
人工智能·深度学习·自然语言处理·数据集·机器翻译·图像生成
综合热讯11 分钟前
脑机接口赋能 认知障碍诊疗迈入精准时代
人工智能·机器学习·数据挖掘
victory043118 分钟前
pytorch 矩阵乘法和实际存储形状的差异
人工智能·pytorch·矩阵
之歆23 分钟前
Spring AI入门到实战到原理源码-多模型协作智能客服系统
java·人工智能·spring
盛世宏博北京25 分钟前
《可复制推广:智慧档案馆 “十防” 安全防护体系建设指南》
网络·人工智能·web安全·智慧档案