AI大模型-提示工程学习笔记8-自我一致性

卷首语:我所知的是我自己非常无知,所以我要不断学习。

写给AI入行比较晚的小白们(比如我自己)看的,大神可以直接路过无视了。

自我一致性

"自我一致性"(Self-Consistency)是提示工程中一种更高级的技术,旨在提升大语言模型在复杂推理任务(如算术和常识推理)中的性能。

核心概念

自我一致性主要用于改进链式思维(Chain-of-Thought, CoT)提示的解码方法。其核心思想是:

  • 传统方法的局限性
    • 在链式思维提示中,通常使用"贪婪解码"(Greedy Decoding)方法,即模型在每一步生成最可能的输出。这种方法可能导致模型沿着单一的推理路径生成答案,但这条路径可能并不总是正确的。
    • 贪婪解码容易陷入局部最优解,尤其是在复杂推理任务中,可能导致错误的推理结果。
  • 自我一致性的改进
    • 自我一致性通过采样多个推理路径,让模型生成多种可能的推理过程。
    • 然后,通过对这些推理路径的最终答案进行统计,选择最一致的答案作为最终输出。
    • 这种方法利用了模型生成多个推理路径的能力,避免了单一推理路径可能带来的错误。

工作流程

自我一致性技术的具体流程如下:

  1. 少样本提示(Few-shot Prompting)
    • 使用少样本链式思维(Few-shot CoT)提示,提供一些示例,指导模型生成推理路径。
    • 示例提示可能是:
  2. 多路径采样
    • 使用非贪婪解码(如随机采样)生成多个推理路径,而不是只生成单一的推理过程。
    • 例如,对于同一个问题,模型可能生成以下推理路径:
      • 路径 1:每个苹果 3 元,买了 2 个,总价 = 3 × 2 = 6 元。
      • 路径 2:苹果总价 = 3 × 2 = 6 元。
      • 路径 3:顾客买了 2 个苹果,每个 3 元,总价 = 6 元。
  3. 答案聚合
    • 对所有生成的推理路径的最终答案进行统计,选择出现次数最多的答案(即最一致的答案)作为最终输出。
    • 例如,如果生成的答案是:
      • 答案 1:6 元(出现 3 次)。
      • 答案 2:5 元(出现 1 次)。
      • 最终选择答案 1(6 元)作为输出。

优势所在

自我一致性技术在提示工程中的优势主要体现在以下几个方面:

  1. 提高推理准确性
    • 通过采样多个推理路径,避免了单一推理路径可能带来的错误。
    • 统计最一致的答案可以更好地反映模型的整体推理能力,而不是依赖单次生成的结果。
  2. 适用于复杂任务
    • 自我一致性特别适合涉及算术推理、常识推理等需要多步推理的任务。
    • 例如,在解决数学问题或逻辑推理问题时,模型可以生成多种推理路径,最终选择最合理的答案。
  3. 利用模型的多样性
    • 大语言模型在生成内容时具有一定的随机性,自我一致性通过采样多个路径,充分利用了模型的这种特性。

与链式思维的关系

  • 链式思维(CoT)
    • 链式思维提示是一种通过引导模型逐步推理的技术,适用于需要多步推理的任务。
    • 例如,解决数学问题时,模型会逐步列出计算过程,而不是直接给出答案。
  • 自我一致性改进了链式思维
    • 链式思维提示通常依赖单一推理路径,而自我一致性通过采样多个路径并聚合答案,进一步提高了链式思维的可靠性和准确性。

应用场景

自我一致性技术可以应用于以下场景:

  1. 算术推理
    • 解决数学问题或涉及多步计算的任务。
    • 例如:计算复杂的数学表达式、解决应用题。
  2. 常识推理
    • 涉及逻辑推理或常识判断的任务。
    • 例如:回答"如果今天是周五,三天后是星期几?"这类问题。
  3. 问答任务
    • 在开放式问答中,生成多个答案并选择最一致的答案。
    • 例如:回答历史事件的时间或地点。
  4. 复杂决策任务
    • 涉及多种可能性的任务,例如推荐系统、路径规划等。

不得不说的局限性

尽管自我一致性技术有显著的优势,但它也存在一些局限性:

  1. 计算成本高
    • 采样多个推理路径需要更多的计算资源,尤其是在生成长文本或复杂推理时。
  2. 答案一致性依赖模型能力
    • 如果模型本身的推理能力不足,生成的多个路径可能都包含错误,最终答案仍可能不正确。
  3. 不适用于所有任务
    • 自我一致性主要适用于需要推理的任务,对于简单的生成任务(如翻译、摘要)可能没有明显优势。

自我一致性是一种改进链式思维提示的高级技术,通过采样多个推理路径并选择最一致的答案,显著提高了模型在复杂推理任务中的性能。它的核心优势在于:

  • 避免单一推理路径的局限性。
  • 提高算术和常识推理任务的准确性。

然而,自我一致性也需要更多的计算资源,并且依赖于模型本身的能力。未来,这种技术可能会与其他提示工程方法(如自动化提示优化)结合,进一步提升大模型的推理能力和可靠性。

相关推荐
API_technology39 分钟前
api开发及运用小红书笔记详情api如何获取笔记详情信息
大数据·开发语言·数据库·数据仓库·笔记·爬虫
大丈夫立于天地间2 小时前
ospf收敛特性及其他的小特性
网络·网络协议·学习·算法·智能路由器·信息与通信
道友老李2 小时前
【机器学习】Kaggle实战Rossmann商店销售预测(项目背景、数据介绍/加载/合并、特征工程、构建模型、模型预测)
人工智能·机器学习
小卡规划2 小时前
检验统计量与p值笔记
笔记
星雨流星天的笔记本4 小时前
英语外刊写作积累(2024.09)
学习
wangqiaowq4 小时前
Apache PAIMON 学习
学习
Seeklike4 小时前
初识NLP
人工智能·自然语言处理
GISer_Jing4 小时前
LLM(大语言模型)支撑下的传统工作流转型发展为AI工作流
人工智能·语言模型·自然语言处理
羊小猪~~5 小时前
MYSQL学习笔记(二):基本的SELECT语句使用(基本、条件、聚合函数查询)
数据库·笔记·sql·学习·mysql·考研·数据分析
然然阿然然5 小时前
2025.1.15——二、字符型注入
网络·数据库·sql·学习·网络安全