聊聊ShareGPT格式的微调数据集

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

概述

ShareGPT格式的数据集中,一般是如下格式:

json 复制代码
[
  {
    "conversations": [
      {
        "from": "human",
        "value": "I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"
      },
      {
        "from": "function_call",
        "value": "{\"name\": \"calculate_discount\", \"arguments\": {\"original_price\": 200, \"discount_percentage\": 20}}"
      },
      {
        "from": "observation",
        "value": "{\"discounted_price\": 160}"
      },
      {
        "from": "gpt",
        "value": "The dress will cost you $160 after the 20% discount."
      }
    ],
    "system": "系统提示词(选填)",
    "tools": "[{\"name\": \"calculate_discount\", \"description\": \"Calculate the discounted price\", \"parameters\": {\"type\": \"object\", \"properties\": {\"original_price\": {\"type\": \"number\", \"description\": \"The original price of the item\"}, \"discount_percentage\": {\"type\": \"number\", \"description\": \"The percentage of discount\"}}, \"required\": [\"original_price\", \"discount_percentage\"]}}]"
  }
]

function_call表示函数调用,什么是函数调用?其作用是什么?

由于大模型的数据一般都是截止于某个时间点之前的数据,不具备实时性。比如,我要问今天的天气,正常来说,由于模型参数的局限性,是不会知道的。但基于函数调用的功能,就解决了这个问题。

所谓的function_call,在某个程度来说,可以理解为API调用,这个API就是一个function,提供了某种功能。
observation表示观测结果,即function_call的执行结果。
tools表示工具,即对function_call的总结描述。

observation并不是新词汇,对于HMM模型如果有了解的话,在其模型算法的表述中,也有着observation的相关引用。

ShareGPT格式简单明了而且结构强大,不仅仅轻易的支持单轮对话、多轮对话;还引入了强大的函数调用,支持功能扩展。

扩展

function_call的设计引申出来,可以对应到业务开发中的规则引擎、脚本引擎等设计。譬如,支持在json参数的格式中,传入JS脚本参数,做一些强大的运算等。在原有的参数格式中,引入强大的函数调用支持。
如何在聊天模型中调用函数(Function Calling)--金融大模型知识库实战(十六)
大模型开发 - 一文搞懂 Function Calling(函数调用)

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

首发于个人公众号

相关推荐
linweidong7 天前
好用到爆,用扣子(coze.cn)搭建自己第一个提升工作效率工具(Hive SQL转Impala SQL助手)过程分享
大数据·数据仓库·hive·hadoop·sql·提示词·智能体
AI_小站10 天前
30个GPT提示词天花板,一小时从大纲到终稿
大数据·人工智能·gpt·llm·agent·提示词·知识库
首飞爱玩机器人19 天前
轻松上手Cursor,体验丝滑编程
ai编程·提示词·cursor
码上飞扬22 天前
如何编写ChatGPT提示词
人工智能·chatgpt·提示词
微学AI1 个月前
大模型提示词工程技术4-提示词架构设计,包括:TAG框架,TRACE框架,ICIO框架
大数据·人工智能·python·框架·提示词
微学AI1 个月前
大模型提示词工程技术3-提示词输入与输出的优化的技巧详细介绍
大模型·提示词
韩曙亮2 个月前
【AI 大模型】提示工程 ③ ( 提示词用法 | 提示词 Prompt 构成 | 提示词位置对权重的影响 | 提示词 Prompt 调优 | OpenAI 的 API 类型 | 提示词重要参数说明 )
人工智能·算法·prompt·openai·提示词·提示词构成·提示词调优
giao客2 个月前
【Agent】信息提取场景
llm·提示词·cot·json格式化·大模型提取·耗时优化·输出质量
大数据AI人工智能培训专家培训讲师叶梓3 个月前
文本到图像的革新:自动化Prompt优化的UF-FGTG框架
图像处理·人工智能·计算机视觉·语言模型·文生图·提示词·多模态
cha1113 个月前
提示词【AI写作】用GPT写一本小说
数据库·gpt·ai写作·提示词