关于agi中的Function Calling深入解析

接口(Interface)

两种常见接口:

1、人机交互接口,User Interface,简称UI

2、应用程序编程接口,Application Programming Interface,简称API

接口能【通】的关键,是两边都要遵守约定。

  • 人要按照UI的设计来操作。UI的设计要符合人的习惯
  • 程序要按照API的设计来调用。API的设计要符合程序惯例。

在日常工作中,调试接口会遇到很多的问题:

  • 文档坑,由于文档写得不规范,不好,要花大把时间有研究。
  • 大小写坑,接口参数名称大小的问题
  • 参数顺序坑
  • 参数类型坑,由于不同语言,参数的类型不可能不一样

接口的进化

  • 命令行,Command Line Interface,简称CLI(DOS、Unix/Linux shell,Widows Power Shell)
  • 图形界面,Graphical User Interfae,简称GUI(Windows、MacOS、IOS、Android)
  • 语言界面,Conversational User Interface,简称CUI,或Natural-Language User Interface,简称LUI
  • 脑机接口,Brain-Computer Interface,简称BCi

什么是API

  • 从本地到远程,从同步到异步,媒介发生很多变化,但本质一直没变:程序员的绽
  • 现在,开始进行到自然语言接口,Natural-Languagge Interface,简称NLI

为什么大模型连接外部世界?

大模型两大缺陷:

  1. 并非知晓一切
    • 训练数据不可能什么都有。垂直、非公开数据笔有欠缺
    • 不知道最新信息。大模型的训练周期很长,且更新一次耗资巨大,还有越训越傻的风险。所以它不可能实时训练。GPT-3.5和的知识截至2021年9月,GPT-4是2023年12月
  2. 没有【真逻辑】。它表现出的逻辑、推理,是训练文本的统计规律,而不是真正的逻辑。所以有幻觉。

所以:大模型需要连接真实世界,并对接真逻辑系统。

用AI来做加法:

  1. 把100以内的所有加法算式都训练给大模型,它就可以回答100以内的加法算式,但仍有概率出错。
  2. 如果问它更大数字的加法,出错概率就会更大
  3. 因为它并不懂【加法】,只是记住了100以内的加法算式的统计规律
  4. 它是用字面意义做数学。

ChatGPT用Actions连接外部世界

第一次尝试:Plugins

  • 2023年3月24日发布plugins,模型可以调用外部的api
  • 2024年4月9日正式下线,宣告失败

第二次尝试:Actions

actions,内置在GPTS中,解决了落地场景问题

流程解析

  1. 通过actios的schema,GPT能读懂各个API能做什么、怎么调用

  2. 拿到prompt,GPT分析出是否调用API才能解析问题

  3. 如果调用api,生成调用参数

  4. ChatGPT调用API

  5. API返回结果,GPT读懂结果,整合到回答中

最后,把AI当人看。

Actions开发示例

复制代码
openapi: 3.1.0
info:
  title: 高德地图
  description: 获取 POI 的相关信息
  version: v1.0.0
servers:
  - url: https://restapi.amap.com/v5/place
paths:
  /text:
    get:
      description: 根据POI名称,获得POI的经纬度坐标
      operationId: get_location_coordinate
      parameters:
        - name: keywords
          in: query
          description: POI名称,必须是中文
          required: true
          schema:
            type: string
        - name: region
          in: query
          description: POI所在的区域名,必须是中文
          required: false
          schema:
            type: string
      deprecated: false
  /around:
    get:
      description: 搜索给定坐标附近的POI
      operationId: search_nearby_pois
      parameters:
        - name: keywords
          in: query
          description: 目标POI的关键字
          required: true
          schema:
            type: string
        - name: location
          in: query
          description: 中心点的经度和纬度,用逗号分隔
          required: false
          schema:
            type: string
      deprecated: false
components:
  schemas: {}

还需要配置API Key来满足权限要求。

这里的所有name、description都是prompt,决定了GPT会不会调用你的API,调用得是否正确。

Function Calling的机制

原理和actions一样,只是使用方式有别。

相关推荐
MichaelIp7 天前
利用ms-swift微调和百炼平台微调大模型
人工智能·gpt·自然语言处理·prompt·aigc·swift·agi
LeeZhao@8 天前
【项目】多模态RAG—本地部署MinerU实现多类文档解析
人工智能·面试·aigc·agi
陈敬雷-充电了么-CEO兼CTO10 天前
深度拆解判别式推荐大模型RankGPT!生成式精排落地提速94.8%,冷启动效果飙升,还解决了传统推荐3大痛点
大数据·人工智能·机器学习·chatgpt·大模型·推荐算法·agi
大千AI助手11 天前
接吻数问题:从球体堆叠到高维空间的数学奥秘
人工智能·agi·deepmind·接吻数·kissingnumber·牛顿·alphaevolve
战场小包1 个月前
AI潮汐日报0813期:Github CEO 辞职、ChatGPT 爆漏洞、下架GPT-4o引起失恋式抗议
人工智能·chatgpt·github·aigc·业界资讯·agi
LeeZhao@1 个月前
【AGI】GPT-5:博士级AI助手的全面进化与协作智能时代的黎明
人工智能·gpt·agi
LeeZhao@1 个月前
【狂飙AGI】2025年上半年中文大模型综合性测评
agi
陈敬雷-充电了么-CEO兼CTO1 个月前
MCP 协议:AI 时代的 “万能转接头”,从 “手动粘贴” 到 “万能接口”:MCP 协议如何重构 AI 工具调用规则?
人工智能·python·gpt·chatgpt·重构·agi·mcp
陈敬雷-充电了么-CEO兼CTO1 个月前
从游戏NPC到手术助手:Agent AI重构多模态交互,具身智能打开AGI新大门
人工智能·深度学习·算法·chatgpt·重构·transformer·agi
陈敬雷-充电了么-CEO兼CTO1 个月前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze