GPT实战系列-探究GPT等大模型的文本生成

GPT实战系列-探究GPT等LLM文本生成

GPT专栏文章:

GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客

GPT实战系列-GPT训练的Pretraining,SFT,Reward Modeling,RLHF-CSDN博客

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

LLM文字创作与人类有什么不同?

  • 人类是如何进行文字创作的?一个有趣的例子就是:写文章。大致有思考兴趣点,构思,篇章与逻辑整理,落笔,修改等过程。过程中一步接一步思考,甚至借用外部工具,搜索资料,计算,验证等过程。回答问题,说话之前往往也会再三思考。
  • LLM语言模型生成文本的方式,依据上下文条件,逐步生成下一个 token,每个 token 计算时间一样,不确定生成的正确性。缺乏前后思考。
思考链(Chain of thought,CoT)
  • 需要推理的任务可以使用 CoT,构造一种思考范式,指明文本生成方向,划分槽位,transformer 需要更多上下文来思考。以 few-shot prompt 为例,让模型以 step-by-step 方式生成。目前也有 zero-shot-CoT,最经典的方式就是使用 Let's think step by step 作为提示词。
一致性(self-consistency)
  • 一致性,有时候生成也会掉到坑里,出不来。比如 transformer 在采样到一个不好的 token 后就很难恢复。
反省(Ask for reflection)
  • 通过灵魂拷问,问 "你完成任务了吗?" 这个问题,让 ChatGPT 对不好的问题进行反思并生成更好的回复。
思考系统2
  • 在《快思考,慢思考》中提到有快思考系统和慢思考系统,Tree of Thoughts(思考树):建议为给定的 prompt 生成多个思路,然后对它们进行评分,并保留好的思路。

扩展LLM能力

代理Chains/Agents
  • React:将任务分解成一系列思考、行动、观察、思考、行动、观察的过程,通过思考来进行问题回复,过程中允许调用外部工具完成任务,比如 google 搜索 API。
使用工具 ( Plugins)
  • 为 ChatGPT,等LLM大模型提供计算器、代码解释器、搜索等工具,协助做 LLM 不擅长的任务。需要调用外部工具的地方需要人为标注出来。
基于检索增强 LLM 能力
  • 获取相关文档,将文档分为块,提取得到数据的 embedding 向量,存储到向量库中。
  • 在测试时,查询向量存储,获取与相关的文档,获得搜索结果。
约束提示(Constrained prompting)
  • 在 LLM 的输出中强制使用特定格式生成的技术。比如,让 LLM 填写一个 json 模板中的内容,其中 json 的 key 是写死的,LLM 负责填补一些空白的 key,这些 key 可以提前进行一些约束,让 LLM 的采样空间受到限制,即能让 LLM 的输出符合预设定的格式。

点个赞 点个赞 点个赞

觉得有用 收藏 收藏 收藏

End


GPT专栏文章:

GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客

GPT实战系列-GPT训练的Pretraining,SFT,Reward Modeling,RLHF-CSDN博客

GPT实战系列-GPT训练的Pretraining,SFT,Reward Modeling,RLHF

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(二)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型,到底做了什么?(一)

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

决策引擎专栏:
Falcon构建轻量级的REST API服务

决策引擎-利用Drools实现简单防火墙策略

相关推荐
山顶夕景3 小时前
【LLM】多模态智能体Kimi-K2.5模型
llm·agent·多模态
JTnnnnn3 小时前
【架構優化】拒絕 LLM 幻覺:設計基於 Python 路由的 AntV 智慧圖表生成系統
llm·antv·dify
AndrewHZ4 小时前
【AI黑话日日新】什么是skills?
语言模型·大模型·llm·claude code·skills
国家一级假勤奋大学生13 小时前
InternVL系列 technical report 解析
大模型·llm·vlm·mllm·internvl·调研笔记
缘友一世20 小时前
张量并行和流水线并行原理深入理解与思考
学习·llm·pp·tp
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2026-01-30)
开源·大模型·llm·github·ai教程
亚里随笔1 天前
MegaFlow:面向Agent时代的大规模分布式编排系统
人工智能·分布式·llm·rl·agentic
向量引擎小橙2 天前
Google 帝国的绝地反击:Gemini 3 深度硬核测评——GPT-5 的噩梦来了吗?
开发语言·人工智能·gpt·深度学习·机器学习
大熊猫侯佩2 天前
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
原来是你~呀~2 天前
Kali GPT - 人工智能渗透测试助手Linux部署
linux·人工智能·gpt·网络安全·自动化渗透测试