cot

juhanishen14 天前
人工智能·chatgpt·cot·agentic ai·agenticai·chain of though
Agentic AI: Chain of Thoughts (COT) CrewAI 一步步解释,从 0 到 1使用 CrewAI 实现 Chain-of-Thought(思维链)与 Chain-of-Action(行动链)的完整步骤说明(中文版)
阿杰学AI17 天前
人工智能·ai·语言模型·aigc·cot·推理模型·reasoning model
AI核心知识63——大语言模型之Reasoning Model (简洁且通俗易懂版)推理模型 (Reasoning Model) 是大语言模型进化出的一个全新物种。如果说 GPT-4、Claude 3 这种传统模型是“反应快、博学多才的百科全书” ;
蓝海星梦20 天前
论文阅读·人工智能·自然语言处理·cot
Chain‑of‑Thought 推理链评估全解析:从参考方法到无参考指标随着大语言模型在多步推理任务中的能力不断提升,Chain-of-Thought(CoT)推理已成为分析与改进模型行为的重要工具。然而,相比推理方法本身,如何可靠地评估模型生成的推理过程这一问题长期缺乏统一答案。
阿杰学AI1 个月前
人工智能·语言模型·自然语言处理·aigc·agi·cot·思维链
AI核心知识30——大语言模型之CoT(简洁且通俗易懂版)CoT 是 Chain-of-Thought(思维链)的缩写。它是提示工程(Prompt Engineering)中最著名、最有效、也是最神奇的一种技术。
Hello.Reader2 个月前
prompt·agent·cot
思维链(CoT)× 智能体(Agent)× 提示词(Prompt)讲解直觉:当一条答案可以由多种正确思路到达时,对 r 进行多样化采样/搜索能提升稳定性与上界。
weixin_377634843 个月前
cot·大模型训练
【COT】PromptCoT 2.0少样本训练 CoT字节与港大提出的 PromptCoT 2.0,在少样本、无强教师、无人工标注条件下,高效生成高质量 CoT(Chain-of-Thought)数据并训练模型。
C7211BA4 个月前
llm·prompt·cot
SGLang简介简单来说,SGLang 是一个用于编写和优化与大语言模型(LLMs)交互程序的框架和领域特定语言(DSL)。它的核心目标是让 LLM 的推理过程跑得更快,同时让复杂的提示词(Prompt)逻辑写起来更简单。
飞机火车巴雷特4 个月前
论文阅读·人工智能·大模型·cot
【论文阅读】LightThinker: Thinking Step-by-Step Compression (EMNLP 2025)论文题目:LightThinker: Thinking Step-by-Step Compression
爱补鱼的猫猫8 个月前
论文阅读·cot
26、思维链Chain-of-Thought(CoT)论文笔记论文题目:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 在大型语言模型中提示推理的思维链 COT论文地址:https://arxiv.org/abs/2201.11903 [Submitted on 28 Jan 2022 (v1), last revised 10 Jan 2023 (this version, v6)]
PLUS_WAVE8 个月前
学习·语言模型·大模型·cot·vlm·推理模型·reasoning
CogCoM: A Visual Language Model with Chain-of-Manipulations Reasoning 学习笔记当前 VLMs 通过对齐视觉输入和语言输出训练,虽然整体表现好,但在需要细致视觉推理的任务上容易出错,比如无法正确识别图片中的细节内容。这是因为现有模型习惯直接给出结论,而缺乏中间推理步骤。
winner88811 年前
大模型·llm·sft·llama·rlhf·cot·大模型综述
大模型综述一镜到底(全文八万字) ——《Large Language Models: A Survey》论文链接:https://arxiv.org/abs/2402.06196摘要:自2022年11月ChatGPT发布以来,大语言模型(LLMs)因其在广泛的自然语言任务上的强大性能而备受关注。正如缩放定律所预测的那样,大语言模型通过在大量文本数据上训练数十亿个模型参数来获得通用语言理解和生成能力。大语言模型的研究领域虽然非常新,但在许多不同方面都在迅速发展。在本文中,我们回顾了一些最杰出的大语言模型,包括三个流行的大语言模型家族(GPT、LLaMA、PaLM),讨论了它们的特点、贡献和局限性。我们还概述了
木亦汐丫1 年前
大模型·prompt·cot·思维链·上下文学习·icl·post-training
大模型从零开始——提示工程 Prompt文章目录上下文学习演示示例选择选择依据选择策略直接检索聚类检索迭代检索性能影响因素预训练数据预训练模型
余胜辉1 年前
人工智能·自然语言处理·cot·模型推理·教学应用
基于COT(Chain-of-Thought Prompt)的教学应用:如何通过思维链提示提升模型推理能力随着人工智能技术的快速发展,大型语言模型(LLMs)在自然语言处理领域展现出了强大的能力。然而,面对复杂的推理任务时,模型的表现往往不尽如人意,尤其是在需要多步逻辑推导的场景中。为了应对这一挑战,Chain-of-Thought Prompt COT技术应运而生。COT通过引导模型生成一系列中间推理步骤,将复杂问题分解为更易处理的子问题,从而显著提升模型的推理能力。
爱喝矿泉水的猛男1 年前
java·人工智能·prompt·cot·tot·pe·ape
Prompt设计技巧和高级PE目录PD and PE:INTRODUCTION AND ADVANCED METHODS1.Instructions
PinkGranite1 年前
gpt·cot·tot·rl·gpt o1
OpenAI GPT-o1实现方案记录与梳理
余生H1 年前
人工智能·经验分享·科技·cot·gpt-o1
ChatGPT01-preivew体验报告:内置思维链和多个llm组合出的COT有啥区别呢?丹田与练气+中学生物理奥赛题测试,名不虚传还是名副其实?一个月前,o1发布的时候,我写了篇文章介绍 逻辑推理能力堪比博士生,OpenAI发布全新AI模型系列: o1 - 大模型或许进入新阶段,还翻译了官方的介绍 解密OpenAI o1是如何让LLMs获得逻辑推理能力的 - CoT * RL,也让人提前体验过,自己却没有进行测试 - 也是这周得以有机会使用,但也是忘了第一时间测试。就是下面的这个: 既然是测试推力理论,当然不能只是简单的题目或者搜索答案。
v_JULY_v1 年前
rlhf·cot·openai o1·mcst·o1复现·openai o1原理
一文通透OpenAI o1:从CoT、Self-Correct/STaR、Self-play RL、MCST等技术细节到工程复现注意,本文自10.12日起,正在每天更新的过程中..可能是去年写或讲的关于ChatGPT原理的文章和课程,影响力太大了
聚梦小课堂1 年前
gpt·cot·技术文档·openai o1·o1·o1 preview·填词游戏
OpenAI GPT o1技术报告阅读(4)- 填字游戏推理原文链接:https://openai.com/index/learning-to-reason-with-llms/
聚梦小课堂1 年前
gpt·大模型·cot·openai o1·o1
OpenAI GPT o1技术报告阅读(2)- 关于模型安全性的测试案例首先是原文链接:https://openai.com/index/learning-to-reason-with-llms/
giao客1 年前
llm·提示词·cot·json格式化·大模型提取·耗时优化·输出质量
【Agent】信息提取场景需要让大模型从文本中提取出固定的字段,同时为了方便后续数据管理,要求大模型输出格式为json格式。会涉及的几个影响提取质量的流程: