0x00 大模型简介
个人问题
1、大模型是什么?
2、ChatGPT 在大模型里是什么?
3、大模型怎么用?
带着问题去学习,记录如下
学习笔记
大模型简介
大语言模型(Large Language Model, 缩写LLM)是旨在理解和生成人类语言的人工智能模型
LLM 被认为是 通用人工智能AGI 的早期形式,LLM 的杰出应用之一就是 ChatGPT
LLM 的能力:
- 涌现能力
- 上下文学习
- 能够综合理解上下文从而更好的执行任务
- 指令遵循
- 无需示例即可按照指令执行任务
- 逐步推理
- LLM 拥有 "思维链" 推理策略
- 上下文学习
- 支持多元应用能力
- LLM 可以成为AI应用开发的基座模型(foundation model),基于其推理、常识和写作能力去建设其他多元应用
- 支持以对话为统一入口的能力
- 以 ChatGPT 为例,典型的通过对话交互进而完成各项工作
LLM 的特点:
- 巨大的规模
- 预训练和微调
- 上下文感知
- 多语言支持
- 多模态支持
- 在语言领域,"模态"通常指的是不同的表达方式或形式,比如文本、图像、语音等
- 涌现能力
- 模型性能随着参数规模增大而提升
- 多领域应用
- 伦理和风险问题
LangChain 简介
LangChain 框架(开源)可以为各种 LLM 应用提供通用接口,从而实现语言模型与其他数据来源连接,并且允许语言模型与其所处的环境进行互动,进而使 LLM 应用达到数据感知和环境互动的效果
LangChain 核心组件
- 模型输入/输出(Model I/O):与语言模型交互的接口
- 数据连接(Data Connection):与特定应用程序的数据进行交互的接口
- 链(Chains):将组件组合实现端到端应用
- 记忆(Memory):用于链的多次运行之间持久化应用程序状态
- 代理(Agents):扩展模型的推理能力。用于复杂的应用的调用序列
- 回调(Callbacks):扩展模型的推理能力。用于复杂的应用的调用序列
小结
1、简要了解了大模型的概念、特点及一些典型应用
2、简要了解 LangChain 框架的作用及核心组件的对应功能
两只陪我熬夜的挖煤小猫呜呜呜
听键盘声睡着的小猫哈哈哈