学习LangChain Agent多参数工具链调用,让大模型去访问网页

写在前面

最近在研究LangChain,简单介绍一下,就是python的一个库,它可以让你的自然语音转为对大模型的任务指令,让它去执行。本质上是将你说的话,将代码构造成各种各样的提示词,从而实现让大模型做知识问答、文档总结、任务拆解甚至是工具调用等一系列操作。这一套框架设计还是很值得去研究学习的。

而对我来说,最有价值的就是通过它创造一个可以帮助你做事情的助手。这篇文章就是想简单分享一下可以打造一个AI助手的技术。

附上github链接

github.com/langchain-a...

Agent类型

LangChain中有一个Agent的概念,就是通过创建一个Agent来去将任务拆解为Chain(链)的形式,帮你去进行工具调用,执行任务。

其中有一个Agent的类型为Structured input ReAct, 该类型是一个支持多输入的工具的类型,可以针对拆解出的任务逐步调用不同的工具完成一个复杂的任务,本篇文章就介绍一下它的使用

示例

下面来看一段示例代码,这里用的大模型是ChatGPT

python 复制代码
import asyncio
import os

from langchain.agents import AgentType
from langchain.chat_models import ChatOpenAI
from langchain.agents import initialize_agent

# 提供好的浏览器自动化工具
from langchain.agents.agent_toolkits import PlayWrightBrowserToolkit
from langchain.tools.playwright.utils import (
create_async_playwright_browser,
create_sync_playwright_browser
)

import nest_asyncio

from settings import API_KEY, BASE_ADDRESS

nest_asyncio.apply()

os.environ["LANGCHAIN_TRACING"] = "true"

async_browser = create_async_playwright_browser(headless=False)
browser_toolkit = PlayWrightBrowserToolkit.from_browser(async_browser=async_browser)
tools = browser_toolkit.get_tools()

llm = ChatOpenAI(model_name="gpt-3.5-turbo-0613", temperature=0, openai_api_key=API_KEY, openai_api_base=BASE_ADDRESS)

# 初始化一个Structured类型的Agent
agent_chain = initialize_agent(tools, llm, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True)


async def run():
    response = await agent_chain.arun(input="打开百度,并看一下网页标题")
    print(response)


if __name__ == '__main__':
    asyncio.run(run())

这是一个调用浏览器自动化的例子

我给出的任务是:打开百度,并看一下网页标题。很明显,这是一个复杂任务(多操作的任务)。

第一步:访问www.baidu.com

第二部:通过element选择器提取标签的网站名

由于我们在例子中设置了verbose=True,这样就可以让我们清晰的看到调用过程

图中我们可以看到,调用过程也确实如一开始所说做任务拆解

先通过navigate_browser工具,传入url参数,来去访问百度

随后通过get_elements工具,传入selector参数,提取title标签内容

示例中没有体现出多输入的概念,但是我们可以看一下其中一个工具的源码,确实是多参数的输入的。

写在后面

我也尝试过通过与大模型对话的方式,固定它的返回格式,同时规范它的参数输入设置,仅凭对话是可以实现的,这仅仅是大模型工具调用的能力可行性验证。然而Langchian能让这个逻辑框架化,这一点确实太牛了,值得深入研究。

相关推荐
AC赳赳老秦1 小时前
OpenClaw image-processing技能实操:批量抠图、图片尺寸调整,适配办公需求
开发语言·前端·人工智能·python·深度学习·机器学习·openclaw
Agent产品评测局1 小时前
企业生产报工自动化落地,数据采集全流程实现方案 —— 2026制造业数字化转型深度选型指南
运维·人工智能·ai·chatgpt·自动化
Project_Observer1 小时前
为您的项目选择最合适的Zoho Projects自动化巧能
大数据·运维·人工智能·深度学习·机器学习·自动化·编辑器
好运的阿财2 小时前
“锟斤拷”问题——程序中用powershell执行命令出现中文乱码的解决办法
linux·前端·人工智能·机器学习·架构·编辑器·vim
沅_Yuan2 小时前
基于LSSVM-ABKDE的多输入单输出回归预测模型【MATLAB】
人工智能·神经网络·机器学习·matlab·回归预测·lssvm·kde
小陈工2 小时前
Python Web开发入门(十八):跨域问题解决方案——从“为什么我的请求被拦了“到“我让浏览器乖乖听话“
开发语言·python·机器学习·架构·数据挖掘·回归·状态模式
AI科技星2 小时前
全维度相对论推导、光速螺旋时空与北斗 GEO 钟差的统一理论
开发语言·线性代数·算法·机器学习·数学建模
Chef_Chen2 小时前
Agent学习--LLM--推理熵
人工智能·学习·机器学习
小鹿软件办公2 小时前
OpenAI 面向高频用户推出全新 100 美元档 ChatGPT Pro 套餐
人工智能·chatgpt
kishu_iOS&AI2 小时前
机器学习 —— 线性回归(实例)
人工智能·python·机器学习·线性回归