cot

爱补鱼的猫猫

26、思维链Chain-of-Thought（CoT）论文笔记论文题目：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 在大型语言模型中提示推理的思维链 COT论文地址：https://arxiv.org/abs/2201.11903 [Submitted on 28 Jan 2022 (v1), last revised 10 Jan 2023 (this version, v6)]

CogCoM: A Visual Language Model with Chain-of-Manipulations Reasoning 学习笔记当前 VLMs 通过对齐视觉输入和语言输出训练，虽然整体表现好，但在需要细致视觉推理的任务上容易出错，比如无法正确识别图片中的细节内容。这是因为现有模型习惯直接给出结论，而缺乏中间推理步骤。

大模型综述一镜到底（全文八万字） ——《Large Language Models: A Survey》论文链接：https://arxiv.org/abs/2402.06196摘要：自2022年11月ChatGPT发布以来，大语言模型（LLMs）因其在广泛的自然语言任务上的强大性能而备受关注。正如缩放定律所预测的那样，大语言模型通过在大量文本数据上训练数十亿个模型参数来获得通用语言理解和生成能力。大语言模型的研究领域虽然非常新，但在许多不同方面都在迅速发展。在本文中，我们回顾了一些最杰出的大语言模型，包括三个流行的大语言模型家族（GPT、LLaMA、PaLM），讨论了它们的特点、贡献和局限性。我们还概述了

大模型从零开始——提示工程 Prompt文章目录上下文学习演示示例选择选择依据选择策略直接检索聚类检索迭代检索性能影响因素预训练数据预训练模型

基于COT（Chain-of-Thought Prompt）的教学应用：如何通过思维链提示提升模型推理能力随着人工智能技术的快速发展，大型语言模型（LLMs）在自然语言处理领域展现出了强大的能力。然而，面对复杂的推理任务时，模型的表现往往不尽如人意，尤其是在需要多步逻辑推导的场景中。为了应对这一挑战，Chain-of-Thought Prompt COT技术应运而生。COT通过引导模型生成一系列中间推理步骤，将复杂问题分解为更易处理的子问题，从而显著提升模型的推理能力。

爱喝矿泉水的猛男

Prompt设计技巧和高级PE目录PD and PE:INTRODUCTION AND ADVANCED METHODS1.Instructions

OpenAI GPT-o1实现方案记录与梳理

ChatGPT01-preivew体验报告：内置思维链和多个llm组合出的COT有啥区别呢？丹田与练气+中学生物理奥赛题测试，名不虚传还是名副其实？一个月前，o1发布的时候，我写了篇文章介绍逻辑推理能力堪比博士生，OpenAI发布全新AI模型系列： o1 - 大模型或许进入新阶段，还翻译了官方的介绍解密OpenAI o1是如何让LLMs获得逻辑推理能力的 - CoT * RL，也让人提前体验过，自己却没有进行测试 - 也是这周得以有机会使用，但也是忘了第一时间测试。就是下面的这个：既然是测试推力理论，当然不能只是简单的题目或者搜索答案。

一文通透OpenAI o1：从CoT、Self-Correct/STaR、Self-play RL、MCST等技术细节到工程复现注意，本文自10.12日起，正在每天更新的过程中..可能是去年写或讲的关于ChatGPT原理的文章和课程，影响力太大了

聚梦小课堂

OpenAI GPT o1技术报告阅读（4）- 填字游戏推理原文链接：https://openai.com/index/learning-to-reason-with-llms/

聚梦小课堂

OpenAI GPT o1技术报告阅读（2）- 关于模型安全性的测试案例首先是原文链接：https://openai.com/index/learning-to-reason-with-llms/

【Agent】信息提取场景需要让大模型从文本中提取出固定的字段，同时为了方便后续数据管理，要求大模型输出格式为json格式。会涉及的几个影响提取质量的流程：

Prompt Engineering Guide本文转载自：Prompt Engineering Guide https://www.promptingguide.ai/zh/introduction/basics

GPT实战系列-探究GPT等大模型的文本生成GPT专栏文章：GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客GPT实战系列-GPT训练的Pretraining，SFT，Reward Modeling，RLHF-CSDN博客

大鹏的NLP博客

NLP中大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT在过去几年的探索中，业界发现了一个现象，在增大模型参数量和训练数据的同时，在多数任务上，模型的表现会越来越好。因而，现有的大模型LLM，最大参数量已经超过了千亿。

江小皮不皮

大模型之Prompt研究和技巧Prompt是是给 AI **模型的指令，**一个简短的文本输入，用于引导AI模型生成特定的回答或执行特定任务。

《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》全文翻译我们探索生成一条思想链（一系列中间推理步骤）如何显着提高大型语言模型执行复杂推理的能力。特别是，我们展示了这种推理能力如何通过一种称为思维链提示的简单方法在足够大的语言模型中自然出现，其中提供了一些思维链演示作为提示的范例。