聊聊ShareGPT格式的微调数据集

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

概述

ShareGPT格式的数据集中,一般是如下格式:

json 复制代码
[
  {
    "conversations": [
      {
        "from": "human",
        "value": "I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"
      },
      {
        "from": "function_call",
        "value": "{\"name\": \"calculate_discount\", \"arguments\": {\"original_price\": 200, \"discount_percentage\": 20}}"
      },
      {
        "from": "observation",
        "value": "{\"discounted_price\": 160}"
      },
      {
        "from": "gpt",
        "value": "The dress will cost you $160 after the 20% discount."
      }
    ],
    "system": "系统提示词(选填)",
    "tools": "[{\"name\": \"calculate_discount\", \"description\": \"Calculate the discounted price\", \"parameters\": {\"type\": \"object\", \"properties\": {\"original_price\": {\"type\": \"number\", \"description\": \"The original price of the item\"}, \"discount_percentage\": {\"type\": \"number\", \"description\": \"The percentage of discount\"}}, \"required\": [\"original_price\", \"discount_percentage\"]}}]"
  }
]

function_call表示函数调用,什么是函数调用?其作用是什么?

由于大模型的数据一般都是截止于某个时间点之前的数据,不具备实时性。比如,我要问今天的天气,正常来说,由于模型参数的局限性,是不会知道的。但基于函数调用的功能,就解决了这个问题。

所谓的function_call,在某个程度来说,可以理解为API调用,这个API就是一个function,提供了某种功能。
observation表示观测结果,即function_call的执行结果。
tools表示工具,即对function_call的总结描述。

observation并不是新词汇,对于HMM模型如果有了解的话,在其模型算法的表述中,也有着observation的相关引用。

ShareGPT格式简单明了而且结构强大,不仅仅轻易的支持单轮对话、多轮对话;还引入了强大的函数调用,支持功能扩展。

扩展

function_call的设计引申出来,可以对应到业务开发中的规则引擎、脚本引擎等设计。譬如,支持在json参数的格式中,传入JS脚本参数,做一些强大的运算等。在原有的参数格式中,引入强大的函数调用支持。
如何在聊天模型中调用函数(Function Calling)--金融大模型知识库实战(十六)
大模型开发 - 一文搞懂 Function Calling(函数调用)

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

首发于个人公众号

相关推荐
结冰架构10 天前
【AI提示词】马斯洛需求分析专家
大数据·人工智能·ai·需求分析·提示词
结冰架构11 天前
【AI提示词】AARRR 模型执行者
大数据·人工智能·ai·提示词·思维模型
结冰架构14 天前
【AI提示词】成本效益分析师
大数据·人工智能·ai·信息可视化·提示词
结冰架构17 天前
【AI提示词】决策树专家
人工智能·算法·决策树·ai·提示词
结冰架构24 天前
【AI提示词】艺人顾问
人工智能·ai·提示词·艺人·顾问
结冰架构1 个月前
【AI提示词】投资策略专家
大数据·人工智能·ai·提示词·专家
结冰架构1 个月前
【AI提示词】金融信息抽取工程师工作流程
人工智能·学习·ai·金融·提示词
结冰架构1 个月前
【AI提示词】Emoji风格排版艺术与设计哲学
大数据·人工智能·ai·提示词
a里啊里啊1 个月前
AI提示词收集(持续更新)
ai·大模型·prompt·开发·提示词
cxr8282 个月前
基于变分推理与 Best‑of‑N 策略的元 Prompt 自动生成与优化框架
人工智能·提示词