Application Development using Large Language Models笔记

诸神缄默不语-个人CSDN博文目录

这是2023年NeurIPS Andrew Ng和Isa Fulford做的tutorial,关于如何用LLM来开发新产品的技术和思路:NeurIPS Tutorial Application Development using Large Language Models

文章目录

  • [1. LLM基础](#1. LLM基础)
  • [2. 提示工程技巧](#2. 提示工程技巧)
  • [3. 微调](#3. 微调)
  • [4. AI创业和其他应用思路](#4. AI创业和其他应用思路)

1. LLM基础

LLM base的思路是"预测下一个token",LLM聊天模型的思路是对齐instructuion(指令),也就是用问答对来继续预训练LLM。这样能让LLM有回答问题 / 遵从指令的能力。

RLHF,对齐人类需求:人工对LLM回答结果打分(实现是比较哪个回答更好),学习人工打分的reward model

2. 提示工程技巧

  1. 加reference
  2. 重复问,用类似模型聚合的方式
  3. 分解任务:分类query
  4. moderation API:检测安全性
  5. 防止prompt injection:
    1. 将用户输入从prompt中分隔出来

      2. 多问一次,有没有prompt injection
  6. 用户给出的例子、低资源语言prompt、代码、"奶奶讲故事"可能会绕过安全限制

3. 微调

  1. 也许只需要200-500个样本

4. AI创业和其他应用思路

  1. 分解人类的实际工作内容,根据技术的可获得性判断AI在哪一步可能有用
  2. 及时监控LLM输出
  3. 评估LLM的表现:制作测试集和评估指标
  4. 用LM评估指标:这一点我记得另外有一篇paper说LLM更倾向于同一LLM生成的结果来着,忘了具体是哪篇了,下次找找
  5. 这玩意仍然难以debug(我对此深有感触)
  6. 定义specific and narrow use case,明确评估指标、成功的标准,评估风险
  7. 用LLM让工作流程更简单、更便宜
  8. LLM基座模型可能会自己变好(什么,AI界自己的摩尔定律)
  9. personalized LLM可能需要LLM在每一层都努力,pretraining阶段就需要考虑文化差异,RLHF阶段有personalized RLHF、group wise RLHF、不同的甚至冲突的preference
  10. LLM的置信度:简单方案是直接问LLM你的confidence是多少;更好的方法是抽样多条回答,检查其一致性
  11. 闭源模型效果好但不好调,还想要长记忆,还想要用户能够实时反馈并得以调整:Andrew的建议是模仿人类的思路一步一步来,这样也方便做错误分析
相关推荐
肥肠可耐的西西公主4 分钟前
前端(AJAX)学习笔记(CLASS 2):图书管理案例以及图片上传
前端·笔记·学习
小白狮ww7 分钟前
国产超强开源大语言模型 DeepSeek-R1-70B 一键部署教程
人工智能·深度学习·机器学习·语言模型·自然语言处理·开源·deepseek
风口猪炒股指标13 分钟前
想象一个AI保姆机器人使用场景分析
人工智能·机器人·deepseek·深度思考
Blankspace空白25 分钟前
【小白学AI系列】NLP 核心知识点(八)多头自注意力机制
人工智能·自然语言处理
Long_poem28 分钟前
【自学笔记】Spring Boot框架技术基础知识点总览-持续更新
spring boot·笔记·后端
Sodas(填坑中....)33 分钟前
SVM对偶问题
人工智能·机器学习·支持向量机·数据挖掘
forestsea41 分钟前
DeepSeek 提示词:定义、作用、分类与设计原则
人工智能·prompt·deepseek
maxruan1 小时前
自动驾驶之BEV概述
人工智能·机器学习·自动驾驶·bev
13631676419侯1 小时前
物联网+人工智能的无限可能
人工智能·物联网
SylviaW081 小时前
神经网络八股(三)
人工智能·深度学习·神经网络