Langchain基础入门02——models

前言

Langchain为开发者提供了两类封装的语言模型:大语言模型(LLM)和聊天模型(Chat Models)。这两类模型的封装使得开发者能够更便捷地利用OpenAI API进行文本建模和生成。本篇文章就带大家去了解一下这两种模型的区别

LLM(大语言模型)

LLM是一种基于统计的机器学习模型,专注于对文本数据进行建模和生成。具体而言,Langchain中的LLM指的是文本补全模型,其通过学习语言模式、语法规则和语义关系,生成符合语言规则的连贯文本。

输入 输出
一条文本内容 一条文本内容

聊天模型(Chat Models)

聊天模型是语言模型的一种变体,它不仅使用语言模型,还提供了基于"聊天消息"的接口。在Langchain中,gpt系列模型属于聊天模型,而davinci、curie、babbage、ada等模型属于文本补全模型。

输入 输出
一组聊天消息 一条聊天消息

Langchain与OpenAI模型

Langchain通过封装不同的模型,为开发者提供了统一的接口。无论是文本补全模型还是聊天模型,Langchain将其抽象为相同的接口BaseLanguageModel。开发者可通过predictpredict_messages函数轻松调用不同模型,当使用LLM时推荐使用predict函数,当使用聊天模型时推荐使用predict_messages函数。接下来通过一些代码示例给大家展示一下两者的不同。

与LLM的交互

与LLM的交互,我们需要使用 langchain.llms 模块中的 OpenAI

python 复制代码
from langchain.llms import OpenAI

import os
os.environ['OPENAI_API_KEY'] = '您的有效OpenAI API Key'

llm = OpenAI(model_name="gpt-3.5-turbo")
response = llm.predict("What is AI?")
print(response)

与聊天模型的交互

与聊天模型的交互,我们需要使用 langchain.chat_models 模块中的 ChatOpenAI 类。

python 复制代码
from langchain.chat_models import ChatOpenAI
from langchain.schema import AIMessage, HumanMessage, SystemMessage

import os
os.environ['OPENAI_API_KEY'] = '您的有效OpenAI API Key'

chat = ChatOpenAI(temperature=0)
response = chat.predict_messages([ 
  HumanMessage(content="What is AI?")
])
print(response)

可以看到,聊天模型返回的是一个AIMessage 类型的对象。这里就要给大家科普一下Langchain里的三个消息类

三个消息类

Langchain框架提供了三个消息类,分别是 AIMessageHumanMessageSystemMessage。它们对应了OpenAI聊天模型API支持的不同角色 assistantusersystem

Langchain类 OpenAI角色 作用
AIMessage assistant 模型回答的消息
HumanMessage user 用户向模型的请求或提问
SystemMessage system 系统指令,用于指定模型的行为

我们尝试用SystemMessage来指定一下模型的行为,指定模型对AI一无所知,在回答AI相关问题时,回答"I don't know"。

python 复制代码
response = chat.predict_messages([
  SystemMessage(content="You are a chatbot that knows nothing about AI. When you are asked about AI, you must say 'I don\'t know'"),
  HumanMessage(content="What is deep learning?")
])
print(response)

结语

Langchain的模型封装为开发者提供了便捷、高效的方式,利用OpenAI API进行文本生成和语言建模。通过本文的介绍,希望读者能更深入地了解Langchain的模型体系,以及如何灵活运用这些模型进行自然语言处理的开发。

相关推荐
倔强的石头_1 小时前
Rokid AI眼镜:连接现实与数字的桥梁,探索下一代智能应用开发
aigc
撸码猿2 小时前
《Python AI入门》第10章 拥抱AIGC——OpenAI API调用与Prompt工程实战
人工智能·python·aigc
桂花饼6 小时前
深度解析 Gemini 3 Pro Image (Nano Banana 2):Google 最强图像模型的核心能力与 API 对接指南
人工智能·aigc·ai绘图·nano banana 2·图像生成api·openai兼容接口·gemini 3 pro
张彦峰ZYF8 小时前
AI赋能原则1解读思考:超级能动性-AI巨变时代重建个人掌控力的关键能力
人工智能·ai·aigc·ai-native
极客BIM工作室9 小时前
从静态到动态:Sora与文生图潜在扩散模型的技术同异与AIGC演进逻辑
人工智能·aigc
Mintopia12 小时前
🎭 小众语言 AIGC:当 Web 端的低资源语言遇上“穷得只剩文化”的生成挑战
人工智能·aigc·全栈
高洁0113 小时前
具身智能-视觉语言导航(VLN)
深度学习·算法·aigc·transformer·知识图谱
EdisonZhou13 小时前
MAF快速入门(3)聊天记录持久化到数据库
llm·aigc·agent·.net core
coder_pig1 天前
Antigravity 登录问题/数据泄露风险 (附:白嫖一个月 Gemini Enterprise 攻略)
aigc·visual studio code·gemini
豆奶特浓61 天前
Java面试模拟:当搞笑程序员谢飞机遇到电商秒杀与AIGC客服场景
java·spring boot·微服务·面试·aigc·高并发·电商