基于Dify智能体开发平台开发一个目标检测智能体

前言

在上一篇文章中，我们介绍了关于目标检测的一些基本定义

本文我们将基于Dify智能体开发平台讲解目标检测小模型从训练到实际业务落地的全流程

本文假设你对Dify智能体开发平台和小南瓜开发平台已有基本的了解

下面我们将基于如下几点进行实战：

1、业务需求
2、模型训练
3、搭建DIfy智能体
4、展示效果

一、业务需求

开发一个智能体，当用户输入一张图片时，识别出来这个图片中有多少个"黄鹤楼"、"万宝路"的盒子。

二、模型训练

1、按照惯例，配置一个表单和列表，用于进行数据的录入和查看数据

2、点击新增按钮，在小南瓜开发平台上将要识别的两个样本进行上传

由于我们没有更多的样本，因此系统自动将上传的图片中的目标图片的位置计算抠取出来生成训练图片(本次实战是随机生成了100张训练图片)

3、通过电脑的画图工具打开图片就能得到目标物品在图片中的X轴、Y轴和宽度信息

复制代码

X轴起点：目标盒子在这个图片中的最小的X轴位置Y轴起点：目标盒子在这个图片中的最小宽度：目标盒子的宽度

4、数据录入后，点击模型训练按钮，开始生成训练数据，并训练模型

5、训练完成后，会得到一个模型的地址(耗时10分钟)

到此就完成了模型的训练。

三、搭建DIfy智能体

这里用到了2个核心的http节点，第一个是上传图片，第二个是调用模型进行检测，最后通过llm节点进行汇总

LLM节点重点提示词如下：

复制代码

##你是一位数据统计分析师，中是返回的目标检测到的每个物品的名字和数量。1、如果data的值为空，则标识没有检测到任何物品2、如果data的值不为空，则有可能是一个数组，targetName字段是识别出来的目标名称，targetNum是识别出来的数量#任务你需要根据识别出来的data中的内容并结合要求，进行汇总反馈总结