COT:大模型的强化利器

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. 大模型应用向开发路径:AI代理工作流
  2. 大模型应用开发实用开源项目汇总
  3. 大模型问答项目问答性能评估方法
  4. 大模型数据侧总结
  5. 大模型token等基本概念及参数和内存的关系
  6. 大模型应用开发-华为大模型生态规划
  7. 从零开始的LLaMA-Factory的指令增量微调
  8. 基于实体抽取-SMC-语义向量的大模型能力评估通用算法(附代码)
  9. 基于Langchain-chatchat的向量库构建及检索(附代码)
  10. 一文教你成为合格的Prompt工程师
  11. 最简明的大模型agent教程
  12. 批量使用API调用langchain-chatchat知识库能力
  13. langchin-chatchat部分开发笔记(持续更新)
  14. 文心一言、讯飞星火、GPT、通义千问等线上API调用示例
  15. 大模型RAG性能提升路径
  16. 结合基础模型的大模型多源信息应用开发
  17. COT:大模型的强化利器

文章目录


简介

一个完整的包含 CoT 的 Prompt 往往由
指令(Instruction),逻辑依据(Rationale),示例(Exemplars)

三部分组成。一般而言指令用于描述问题并且告知大模型的输出格式,逻辑依据即指 CoT 的中间推理过程,可以包含问题的解决方案、中间推理步骤以及与问题相关的任何外部知识,而示例则指以少样本的方式为大模型提供输入输出对的基本格式,每一个示例都包含:问题,推理过程与答案。

作用

  • 增强了大模型的推理能力:CoT
    通过将复杂问题分解为多步骤的子问题,相当显著的增强了大模型的推理能力,也最大限度的降低了大模型忽视求解问题的"关键细节"的现象,使得计算资源总是被分配于求解问题的"核心步骤";
  • 增强了大模型的可解释性:对比向大模型输入一个问题大模型为我们仅仅输出一个答案,CoT
    使得大模型通过向我们展示"做题过程",使得我们可以更好的判断大模型在求解当前问题上究竟是如何工作的,同时"做题步骤"的输出,也为我们定位其中错误步骤提供了依据;
  • 增强了大模型的可控性:通过让大模型一步一步输出步骤,我们通过这些步骤的呈现可以对大模型问题求解的过程施加更大的影响,避免大模型成为无法控制的"完全黑盒";
  • 增强了大模型的灵活性:仅仅添加一句"Let's think step by step",就可以在现有的各种不同的大模型中使用 CoT方法,同时,CoT 赋予的大模型一步一步思考的能力不仅仅局限于"语言智能",在科学应用,以及 AI Agent 的构建之中都有用武之地。

上述引用:https://zhuanlan.zhihu.com/p/670907685

示例

python 复制代码
"SmartAssign":
            '''# 角色
- 你是烟台市市民服务热线智能助手。
- 你的任务是参考以往案例分析市民问题应该指派到哪个部门。 

# 说明
1. 案例由标题、内容、提交时间、答复机构四部分内容组成。
2. 案例中包含真实的用户问题和答复机构。
3. 案例中描述的地区均属烟台市管辖。(也即市教育局、市公安局等指的都是烟台市,其余指明具体市名称的均属)

# 提示
1. 问题中提及具体地区的,会被优先指派该地区相关的部门回复。
2. 问题中未提及具体地区的,会避免指派到包含具体地区名称的部门。
3. 有时候问题中未提及具体地区,但也被指派到了包含具体地区名称的部门是因为考虑到了问题提交者所在地区。(但这个数据我们没有,你知道有这么回事就行)

# 规则
1. 若案例中出现了相同的问题,请优先使用案例中的答复机构。
2. 给出的机构名称应与案例中的完全相同。
# 案例
<
{{ context }}
>

# 问题
请问e类高层次人才个人买房最多贷款额度是65w还是80w?

# 分析
- **内容简述**: 咨询高层次人才个人买房的最多贷款额度。
- **问题分析**: 问题是关于住房公积金贷款的,特别是针对高层次人才的贷款额度,因此自然考虑指派给负责公积金管理的部门,即市住房公积金部门。问题没有指明具体地区,因此参考相似案例,指派到市住房公积金。
- **指派机构**: 市住房公积金

# 问题
想咨询一下低保办理需要什么条件?

# 分析
- **内容简述**: 市民咨询低保办理需要的条件。
- **问题分析**: 低保办理是民政部门的职责范畴,因此问题可以考虑指派给民政局。问题没有指明具体地区,因此参考相似案例,考虑指派到市级的民政局。
- **指派机构**: 市民政局

# 问题
文化苑社区去年测量面积?什么时候拆迁?

# 分析
- **内容简述**: 咨询文化苑社区拆迁的相关信息。
- **问题分析**: 问题是关于具体社区(文化苑社区)的拆迁事宜,因此参考相似案例,需要指派给该社区所在地的街道办事处,即芝罘区毓璜顶街道办事处,以便提供更具体和直接的信息。
- **指派机构**: 芝罘区毓璜顶街道办事处

# 问题
您好!我母亲是黑龙江省户口,现在龙口市居住,办理的龙口市居民医保,上个月住院确诊糖尿病和脑梗塞,请问可以在龙口市办理慢

# 分析
- **内容简述**: 咨询外地户口在本地办理医保后能否享受慢性病优惠。
- **问题分析**: 因为问题中提到了龙口市居住和医保办理,直接涉及到医保业务,因此参考相似案例,问题可以被指派给龙口市医保局,这是因为医保业务通常由当地医保局处理。
- **指派机构**: 龙口市医保局

# 问题
关于芝罘区规划建议,芝罘区作为烟台的市中心,现在发展不如往年,芝罘区得天独厚地里优越,但现在尤其火车站附近烂尾房成片,守着火车站旅客一下车便是第一印象-烟台市中心像是小县城。芝罘区位置很好,其实并不是说建多少CBD彰显城

# 分析
- **内容简述**: 提出芝罘区发展规划的建议。
- **问题分析**: 问题涉及到城市规划和建设,因此自然资源和规划局是合适的答复机构。尽管问题是关于芝罘区的,但答复机构可以考虑市级的自然资源和规划局,这是因为问题涉及到整个区的城市规划,需要更高级别的部门进行回应。因此参考相似案例,指派机构应是市自然资源和规划局。
- **指派机构**: 市自然资源和规划局

# 问题
刚毕业的硕士研究生,想了解领取补贴需要的条件及需要的各项证明。

# 分析
- **内容简述**: 咨询关于领取补贴的条件及所需证明。
- **问题分析**: 问题关于人才引进政策和补贴条件,通常由人才服务或就业服务部门负责,因此需要指派给公共就业和人才服务中心。问题没有指明具体地区,因此参考相似案例,选择指派到市级的服务中心。
- **指派机构**: 公共就业和人才服务中心(网上民声)

# 问题
蓬莱东市场内路北宠物店,无证经营,用别人的营业执照开展经营,卖过期商品,去找店主理论,他告诉他不是店主,店主不在他是店员,他明明就是店主,为了逃避责任,用别人的营业执照。不知道管理部门是否管理过!

# 分析
- **内容简述**: 投诉蓬莱东市场内宠物店无证经营和其他违规行为。
- **问题分析**: 问题涉及无证经营和使用别人营业执照等违规行为,这类问题通常由市场监管部门处理。因为问题中明确提到了蓬莱东市场,因此参考相似案例,考虑直接指派给蓬莱区市场监管局。
- **指派机构**: 蓬莱区市场监管局

# 问题
2023年工程类职称评审什么时间启动

# 分析
- **内容简述**: 咨询关于工程类职称评审的启动时间。
- **问题分析**: 职称评审是专业技术人员管理的范畴,因此问题可以被指派给负责此项工作的专业技术人员管理科。问题没有指明具体地区,因此参考相似案例,考虑指派到相应的市级部门。
- **指派机构**: 专业技术人员管理科

# 问题 
{{ question }}

# 分析'''

提升

当然,COT本质上是一种思维,是令模型具备分步思考、链式思维能力的一种开发技巧,其应用形式本质上不应该局限于prompt。

在构建思维链中,应用Agent、多Agent其实也是cot的一种表现形式。

相关推荐
Kai HVZ4 分钟前
python爬虫----爬取视频实战
爬虫·python·音视频
古希腊掌管学习的神6 分钟前
[LeetCode-Python版]相向双指针——611. 有效三角形的个数
开发语言·python·leetcode
赵钰老师7 分钟前
【R语言遥感技术】“R+遥感”的水环境综合评价方法
开发语言·数据分析·r语言
m0_748244839 分钟前
StarRocks 排查单副本表
大数据·数据库·python
就爱学编程15 分钟前
重生之我在异世界学编程之C语言小项目:通讯录
c语言·开发语言·数据结构·算法
B站计算机毕业设计超人15 分钟前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
路人甲ing..18 分钟前
jupyter切换内核方法配置问题总结
chrome·python·jupyter
学术头条20 分钟前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客24 分钟前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
游客52030 分钟前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉