《LangChain入门指南》学习笔记1:第1章 LangChain:开启大语言模型时代的钥匙

LangChain:开启大语言模型时代的钥匙

大语言模型(Large Language Model, LLM)概述

什么是LLM

  • 起源:基于Transformer架构,大规模神经网络程序
  • 核心:通用人工智能模型
  • 训练机制:"单字接龙"模式
  • 结果:获得语言智能

LLM的发展

  • 里程碑:ChatGPT (GPT-3.5) 发布
  • 当前顶峰:GPT-4
  • 全球主流模型
    • OpenAI: GPT-4
    • Anthropic: Claude 2
    • Meta: LLaMA 2 (开源)
    • Google: PaLM 2
  • 中国主流模型
    • 百度:文心一言
    • 阿里巴巴:通义千问
    • 华为:盘古大模型
    • 科大讯飞:星火

LLM的应用场景

  • 智能对话
  • 文本生成
  • 知识问答
  • 文本总结
  • 文本翻译
  • 情感分析
  • 数据分析
  • 编程辅助
  • 文档格式转换
  • 信息抽取

LLM的基础知识

GPT vs ChatGPT
  • GPT:模型 (Model)
  • ChatGPT:产品 (Product)
提示词(Prompt)
  • 定义:驱动模型的命令
  • 重要性:决定输出质量
  • 通用模板:角色-背景-任务-输出
  • 模板示例:
Token:大语言模型的基本单位
  • 定义:模型处理文本的基本单位
  • 功能:商用计费单位
  • 对比:不同于编程语言的字符
上下文长度(Context Length)
  • 定义:模型的"脑容量"
  • 示例:8K, 32K, 128K (GPT-4 Turbo)
  • 影响:成本与能力的权衡
幻觉
  • 现象:生成看似合理但偏离事实的预测
  • 根源:模式模仿而非真正理解
  • 案例:生成内容编造不存在的API、网址
微调(Fine-tune)
  • 比喻:基础训练 vs 赛前特训
  • 方式:通过API提供QA数据对
  • 目的:获得专属模型

LangChain与LLM

  • 诞生:2022年10月,Harrison Chase
  • 发展:从开源项目到估值2亿美元的初创公司
  • 定位:LLM应用的编程框架
  • 核心价值
    • 连接LLM、工具与数据
    • 弥补LLM短板

思维导图:

相关推荐
资深web全栈开发13 分钟前
深度对比 LangChain 8 种文档分割方式:从逻辑底层到选型实战
深度学习·自然语言处理·langchain
Qhumaing14 分钟前
C++学习:【PTA】数据结构 7-2 实验6-2(图-邻接表)
数据结构·c++·学习
知行力22 分钟前
【GitHub每日速递 20260108】告别云服务弊端,Memos隐私至上自托管笔记服务来袭!
笔记·github
好奇龙猫24 分钟前
【日语学习-日语知识点小记-日本語体系構造-JLPT-N2前期阶段-第一阶段(1):再次起航】
学习
FranzLiszt184725 分钟前
基于One API 将本地 Ollama 模型接入 FastGPT
langchain·fastgpt·rag·ollama·one api
wdfk_prog28 分钟前
[Linux]学习笔记系列 -- [fs]sysfs
linux·笔记·学习
菜的不敢吱声1 小时前
swift学习第5天
学习·ssh·swift
其美杰布-富贵-李1 小时前
TabNet: 注意力驱动的可解释表格学习架构
学习·表格数据·tabnet
im_AMBER2 小时前
Leetcode 98 从链表中移除在数组中存在的节点
c++·笔记·学习·算法·leetcode·链表
jamesge20102 小时前
kafka学习笔记
笔记·学习·kafka