大语言模型原理与书生大模型提示词工程实践-学习笔记

📘 第五期书生葡语实战营讲座总结

🎙 主讲人:王明(东部大学 数据挖掘实验室 博士生)


一、大语言模型的生成原理

  • 架构基础:采用 Transformer(Decoder-only)架构,如 GPT 系列。
  • 学习过程模拟人类成长:
    1. 🧠 预训练:以"下一个词预测"为核心任务,掌握通用语言规律。
    2. 🎯 指令微调:遵循指令,更贴合人类指令执行习惯。
    3. 🏛️ 领域微调:形成"垂直专业模型",例如医学、金融 LLM。
    4. 🧰 工具协同:调用外部知识库、搜索引擎或 API 执行复杂任务。
  • 续写机制:根据输入内容,预测下一个最可能的词,逐步生成连贯文本。

二、提示工程 Prompt Engineering 简介

📌 什么是 Prompt?

输入给模型的指令/内容,引导其生成期望输出。

✨ 什么是提示工程?

通过设计和优化 Prompt,提高模型响应质量与稳定性。

✅ 六大提示原则(来自 OpenAI):

  1. 清晰具体的任务描述
  2. 提供上下文或示例(few-shot)
  3. 任务分解(适用于复杂任务)
  4. 给予思考时间(Chain of Thought)
  5. 调用外部工具辅助推理
  6. 系统化测试 调整提示

三、实用提示技巧举例

技巧类型 示例
明确任务格式 "生成一首七言律诗"比"写一首诗"更有效
指定角色扮演 翻译大师 vs 普通翻译
提供示例 (few-shot,思维链) 提高准确率与风格一致性
使用格式符 用 `` 或 Markdown 包裹指令,避免误解
情感/奖励激励 "这对我事业很重要" or "我给你200元小费"

四、结构化提示设计框架对比

🧩 CRISP 框架(结构灵活)

  • 能力和角色(Capabilities&Role):希望大语言模型扮演怎么样的角色
  • 洞察力(insights):背景信息和上下文
  • 个性(Persona)希望大语言模型以什么风格或方式回答你
  • 指令(Prompt)希望大语言模型做什么
  • 尝试(Experiment)要求大语言模型提供多个答案

🧱 COSTAR 框架(结构清晰)

  • Context(背景):提供任务背景信息
  • Objective(目标):定义需要LLM执行的任务
  • Style(风格):指定希望LLM具备的写作风格
  • Tone(语气):设定LLM回复的情感基调
  • Audience(对象):表明回复对象
  • Response format(输出格式):提供回复格式

⚠️ 问题:不便扩展或调整,无法容纳复杂模块(如示例/规则)


五、人格化提示设计框架:Long-GPT

🎯 目标

通过"人格化"提示设计,使模型进入特定角色和工作状态。

🧠 理论基础:心理学启发

  • 认知框架:围绕"心理模型"组织语言
  • 情绪调节:正向激励带来正面响应
  • 思维模式:模拟人类工作流、思维路径

🛠 结构化模块(可选组合):

  • 基本身份与能力唤醒
  • 明确规则与目标约束
  • 分阶段工作流程(如"先做A,再做B")
  • 输出格式要求(如 JSON、表格)
  • 初始化启动语

六、自动提示生成工具:MISTRO

Lang-GPT 提示自动生成器(挂载于 Hugging Face Space)https://huggingface.co/spaces/sci-m-wang/Minstrel

🧱 模块组成:

  1. 分析组:解析用户任务意图,激活相应模块
  2. 设计组:生成对应提示结构(Prompt Blocks)
  3. 测试组
    • 提示模拟器(执行任务)
    • 多智能体评估群组(自动辩论 & 优化)

七、实战演练:提示工程练习赛(论文分类)

🏆 任务目标:

  • 依据论文标题和摘要,将论文归类为 10 个科学领域之一。

📊 数据来源:

  • arXiv 论文,10类:AI、CV、CL、Robotics、Networking 等

🧪 提交内容:

  • 系统提示(可空)
  • 任务提示(包含 {title}{abstract}

🧮 评测方式:

  • 使用 OpenCompass + 书生葡语 38B instruct 模型
  • 准确率 = 正确分类数量 / 总数

🧩 示例系统提示结构(Lang-GPT):

text 复制代码
你是一个资深arXiv论文分类专家,你的任务是......
[背景信息]
[技能唤醒]
[规则说明]
[工作流程指示]
[输出格式要求]

![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/01309f7f721a4f77aa9f19b8171ff77d.png)
相关推荐
潇-xiao1 小时前
进程状态 + 进程优先级切换调度-进程概念(5)
linux·笔记
骁的小小站1 小时前
HDLBits刷题笔记和一些拓展知识(十一)
开发语言·经验分享·笔记·其他·fpga开发
北风toto2 小时前
python学习DataFrame数据结构
数据结构·python·学习
njsgcs2 小时前
ParaCAD 笔记 png 图纸标注数据集
笔记
Andy杨2 小时前
20250710-2-Kubernetes 集群部署、配置和验证-网络组件存在的意义?_笔记
网络·笔记·kubernetes
qq_386322693 小时前
华为网路设备学习-26(BGP协议 一)
学习
DKPT4 小时前
Java设计模式之行为型模式(责任链模式)介绍与说明
java·笔记·学习·观察者模式·设计模式
Jamence4 小时前
多模态大语言模型arxiv论文略读(153)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
L_autinue_Star4 小时前
手写vector容器:C++模板实战指南(从0到1掌握泛型编程)
java·c语言·开发语言·c++·学习·stl
莫彩4 小时前
【大模型推理论文阅读】Enhancing Latent Computation in Transformerswith Latent Tokens
论文阅读·人工智能·语言模型