【LLM】0x00 大模型简介

0x00 大模型简介

个人问题

1、大模型是什么?

2、ChatGPT 在大模型里是什么?

3、大模型怎么用?

带着问题去学习,记录如下

学习笔记

大模型简介

大语言模型(Large Language Model, 缩写LLM)是旨在理解和生成人类语言的人工智能模型

LLM 被认为是 通用人工智能AGI 的早期形式,LLM 的杰出应用之一就是 ChatGPT

LLM 的能力:

  • 涌现能力
    • 上下文学习
      • 能够综合理解上下文从而更好的执行任务
    • 指令遵循
      • 无需示例即可按照指令执行任务
    • 逐步推理
      • LLM 拥有 "思维链" 推理策略
  • 支持多元应用能力
    • LLM 可以成为AI应用开发的基座模型(foundation model),基于其推理、常识和写作能力去建设其他多元应用
  • 支持以对话为统一入口的能力
    • 以 ChatGPT 为例,典型的通过对话交互进而完成各项工作

LLM 的特点:

  • 巨大的规模
  • 预训练和微调
  • 上下文感知
  • 多语言支持
  • 多模态支持
    • 在语言领域,"模态"通常指的是不同的表达方式或形式,比如文本、图像、语音等
  • 涌现能力
    • 模型性能随着参数规模增大而提升
  • 多领域应用
  • 伦理和风险问题

LangChain 简介

LangChain 框架(开源)可以为各种 LLM 应用提供通用接口,从而实现语言模型与其他数据来源连接,并且允许语言模型与其所处的环境进行互动,进而使 LLM 应用达到数据感知和环境互动的效果

LangChain 核心组件

  • 模型输入/输出(Model I/O):与语言模型交互的接口
  • 数据连接(Data Connection):与特定应用程序的数据进行交互的接口
  • 链(Chains):将组件组合实现端到端应用
  • 记忆(Memory):用于链的多次运行之间持久化应用程序状态
  • 代理(Agents):扩展模型的推理能力。用于复杂的应用的调用序列
  • 回调(Callbacks):扩展模型的推理能力。用于复杂的应用的调用序列

小结

1、简要了解了大模型的概念、特点及一些典型应用

2、简要了解 LangChain 框架的作用及核心组件的对应功能

两只陪我熬夜的挖煤小猫呜呜呜

听键盘声睡着的小猫哈哈哈

参考资料

动手学大模型 - 第一章 大模型简介

相关推荐
计算机徐师兄几秒前
Python基于Django的web漏洞挖掘扫描技术的实现与研究(附源码,文档说明)
python·django·漏洞扫描·web漏洞挖掘扫描·python django·python漏洞挖掘扫描技术
m0_74824661几秒前
【论文投稿】Python 网络爬虫:探秘网页数据抓取的奇妙世界
开发语言·爬虫·python
minstbe5 分钟前
AI开发 - 算法基础 递归 的概念和入门(二)汉诺塔问题 递归的应用和使用注意 - Python
开发语言·python·算法
刘懿儇13 分钟前
大语言模型的token和向量
ai·语言模型·chatgpt
web1478621072320 分钟前
Python毕业设计选题:基于django+vue的疫情数据可视化分析系统
python·信息可视化·课程设计
两水先木示22 分钟前
【Unity3D】ECS入门学习(九)SystemBase
学习·unity·ecs
岁月如歌,青春不败29 分钟前
HMSC联合物种分布模型
开发语言·人工智能·python·深度学习·r语言
susu108301891131 分钟前
python中Windows系统使用 pywin32 来复制图像到剪贴板,并使用 Selenium 模拟 Ctrl+V 操作
python·selenium
Pocker_Spades_A34 分钟前
阿里云-通义灵码:在 PyCharm 中的强大助力(下)
ide·python·阿里云·pycharm
chengxuyuan1213_42 分钟前
Python有哪些常用的库
开发语言·python