大模型实现工具调用的方式

大模型实现工具调用的方式

大模型只有文字输出能力,它是不具备工具调用等能力的,如果要给大模型扩充这个能力,就需要在把用户消息提交给大模型之前,做点别的事情。

如何让大模型支持工具调用呢?

因为大模型只会文字输出,所以要实现工具调用,我们只能是在它之前做这些事情。具体怎么做呢?

得先在系统提示词(systemMessage)这里加上类似这样的提示语:"如果用户请求需要调用函数,请按以下格式输出:{"name": "函数名", "arguments": {}}"

接下来我们定义好一个函数描述:

json 复制代码
{
    "name": "get_weather",
    "description": "获取指定城市的天气",
    "parameters": {
        "type": "object",
        "properties": {
            "location": {"type": "string", "description": "城市名称"},
            "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
        },
        "required": ["location"]
    }
}

然后再定义get_weather函数:

js 复制代码
async function getWeather(location, unit) {
    const url = `https://weather.api?city=${location}&unit=${unit}`;
    const response = await fetch(url);
    const data = await response.json();
    return data.temperature;
}

准备好函数后,这时用户提问:"上海现在多少度?"

这时就把用户的问题先提交给大模型,让大模型决策是否需要工具调用。

此时大模型根据系统提示词可能给我们这样的回复:

json 复制代码
{
  "name": "get_weather",
  "arguments": {
    "location": "上海",
    "unit": "celsius"
  }
}

我们得到这样的回复后,就可以解析这个 JSON 内容了并做工具调用了:

js 复制代码
const funcObj = JSON.parse(answer);
let res;
if (funcObj.name === 'get_weather') {
  res = await getWeather(funcObj.arguments.location, funcObj.arguments.unit);
}

这个 res 的返回值可能是这样的:

json 复制代码
{"temperature": 28, "unit": "celsius"}

然后我们根据函数的返回值再去组合一下提示词:

text 复制代码
用户问:上海现在多少度?
工具返回:{"temperature": 28, "unit": "celsius"}
请生成友好回复:

把提示词提交给大模型后,得到的回复可能是这样的:上海当前气温28摄氏度。

到此我们就完整的实现了一个大模型的工具调用了。

当然,上述原理和示例都比较简单,属于一个大概的流程。要能够在生产环境下面使用,还得使用一些做的比较完备的工具,比如使用 OpenAI 的 function_call 功能,或者使用 LangChain 这些做的比较好的工具。

再来说说 MCP,可以看到上面的函数调用的形式,我可以自己手写,也可以用别人的工具,都没有一个统一的规范,也不太好把自己的工具分享给别人使用。

于是做 Claude 产品的这家公司就定义了一套规范,让工具使用端与工具提供端统一了一套接口规范,这样只要你提供的工具符合这个规范,我就可以按照这个规范去调用你的工具。这属于一个比较高的抽象层面了。他们官网提供了客户端实现和提供端实现,使用起来也比较方便。

相关推荐
Cobyte16 分钟前
AI全栈实战:使用 Python+LangChain+Vue3 构建一个 LLM 聊天应用
前端·后端·aigc
NEXT0629 分钟前
前端算法:从 O(n²) 到 O(n),列表转树的极致优化
前端·数据结构·算法
剪刀石头布啊35 分钟前
生成随机数,Math.random的使用
前端
剪刀石头布啊36 分钟前
css外边距重叠问题
前端
剪刀石头布啊36 分钟前
chrome单页签内存分配上限问题,怎么解决
前端
剪刀石头布啊38 分钟前
css实现一个宽高固定百分比的布局的一个方式
前端
剪刀石头布啊42 分钟前
js数组之快速组、慢数组、密集数组、稀松数组
前端
mango_mangojuice1 小时前
Linux学习笔记(make/Makefile)1.23
java·linux·前端·笔记·学习
Days20501 小时前
简单处理接口返回400条数据本地数据分页加载
前端
Novlan12 小时前
@tdesign/uniapp 图标瘦身
前端