【LLM】0x00 大模型简介

安悦悦ya2023-11-15 7:07

0x00 大模型简介

个人问题
学习笔记
- 大模型简介
- - [LLM 的能力：](#LLM 的能力：)
  - [LLM 的特点：](#LLM 的特点：)
- [LangChain 简介](#LangChain 简介)
- - [LangChain 核心组件](#LangChain 核心组件)
- 小结
- 参考资料

个人问题

1、大模型是什么？

2、ChatGPT 在大模型里是什么？

3、大模型怎么用？

带着问题去学习，记录如下

学习笔记

大模型简介

大语言模型（Large Language Model, 缩写LLM）是旨在理解和生成人类语言的人工智能模型

LLM 被认为是 通用人工智能AGI 的早期形式，LLM 的杰出应用之一就是 ChatGPT

LLM 的能力：

涌现能力
- 上下文学习
  - 能够综合理解上下文从而更好的执行任务
- 指令遵循
  - 无需示例即可按照指令执行任务
- 逐步推理
  - LLM 拥有 "思维链" 推理策略
支持多元应用能力
- LLM 可以成为AI应用开发的基座模型（foundation model），基于其推理、常识和写作能力去建设其他多元应用
支持以对话为统一入口的能力
- 以 ChatGPT 为例，典型的通过对话交互进而完成各项工作

LLM 的特点：

巨大的规模
预训练和微调
上下文感知
多语言支持
多模态支持
- 在语言领域，"模态"通常指的是不同的表达方式或形式，比如文本、图像、语音等
涌现能力
- 模型性能随着参数规模增大而提升
多领域应用
伦理和风险问题

LangChain 简介

LangChain 框架（开源）可以为各种 LLM 应用提供通用接口，从而实现语言模型与其他数据来源连接，并且允许语言模型与其所处的环境进行互动，进而使 LLM 应用达到数据感知和环境互动的效果

LangChain 核心组件

模型输入/输出（Model I/O）：与语言模型交互的接口
数据连接（Data Connection）：与特定应用程序的数据进行交互的接口
链（Chains）：将组件组合实现端到端应用
记忆（Memory）：用于链的多次运行之间持久化应用程序状态
代理（Agents）：扩展模型的推理能力。用于复杂的应用的调用序列
回调（Callbacks）：扩展模型的推理能力。用于复杂的应用的调用序列

小结

1、简要了解了大模型的概念、特点及一些典型应用

2、简要了解 LangChain 框架的作用及核心组件的对应功能

两只陪我熬夜的挖煤小猫呜呜呜

听键盘声睡着的小猫哈哈哈

参考资料

动手学大模型 - 第一章大模型简介

上一篇：GPT-4 Turbo Assistants API

下一篇：Java虚拟机的垃圾回收机制

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05OpenClaw优化飞书API 额度已耗尽问题 06小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08Window 10部署openclaw报错node.exe : npm error code 128 09【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 10网站改了域名，如何查找？