K210视觉识别模块学习笔记6: 识别苹果_图形化操作函数_

今日开始学习K210视觉识别模块: 图形化操作函数

亚博智能 K210视觉识别模块......

固件库: canmv_yahboom_v2.1.1.bin

训练网站: 嘉楠开发者社区

今日学习如何在识别到目标的时候添加图形化操作:(获取坐标、框出目标等)

在识别苹果的基础上 学习与添加 这些操作,获取苹果的坐标,框图等信息

文章提供测试代码讲解、完整代码贴出、测试效果图

目录

训练识别苹果的模型:

认识图形化操作函数:

整体工程代码贴出


训练识别苹果的模型:

依旧是之前的训练网站:

这个网站生成的模型里面的python文件代码需要自己做一些对应的修改,以下贴出的文章解释了如何修改,只需几步就可以了: 具体对应步骤在下面的笔记中提到过:

K210视觉识别模块学习笔记5:(嘉楠)训练使用模型_识别人脸-CSDN博客

这里我拍摄标注了52张图片作为数据集来训练,发现还是能训练出稳定的模型的:

认识图形化操作函数:

dect 列表中的每个元素 l ,是一个包含物体边界框坐标和标签索引的元组或列表:

绘制矩形框,其中 l[0], l[1], l[2], l[3] 是矩形框的左上角和右下角的坐标(通常是 (x1, y1, x2, y2) 的形式):

与检测到物体的坐标直接相关的部分是 l[0], l[1], l[2], l[3],它们被用来绘制表示物体边界的矩形框。而 l[0], l[1] 在绘制文本标签时也被用作文本的起始位置,但它们本身并不表示物体的坐标。

a = img.draw_string(l[0],l[1],info,color=(255,0,0),scale=2.0):

函数img.draw_string 这是用于在图像 img 上绘制一个字符串。

* `l[0], l[1]`:

这是两个坐标值,通常表示图像上的点(x, y)。在这里,`l` 是一个列表或元组,其中 `l[0]` 和 `l[1]` 分别代表x坐标和y坐标。这些坐标通常定义了字符串在图像上的起始位置。

* `info`:

这是要绘制在图像上的字符串内容。从代码中可以看出,`info` 是一个格式化的字符串,包含了物体的标签和某种分数或概率(由 `labels[l[4]]` 和 `l[5]` 构成)。

* `color=(255,0,0)`:

这是一个RGB颜色值,指定了绘制字符串时使用的颜色。在这个例子中,颜色是红色的,因为红色在RGB中由 (255, 0, 0) 表示。

* `scale=2.0`:

这是一个缩放因子,用于控制绘制字符串时的大小。在这里,字符串的大小是原始大小的2倍。

整体工程代码贴出:

https://download.csdn.net/download/qq_64257614/89486020?spm=1001.2014.3001.5503

相关推荐
winfreedoms19 小时前
ROS2语音&ai与控制——黑马程序员ROS2课程上课笔记(6)
人工智能·笔记
执于代码19 小时前
IEDA工具总结笔记
笔记
我命由我1234519 小时前
Photoshop - Photoshop 工具栏(67)修补工具
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop
山岚的运维笔记20 小时前
SQL Server笔记 -- 第72章:隔离级别与锁定
数据库·笔记·后端·sql·microsoft·sqlserver
DeepModel20 小时前
第15章 多模态学习
深度学习·学习·机器学习
不吃橘子的橘猫20 小时前
《集成电路设计》复习资料2(设计基础与方法)
学习·算法·fpga开发·集成电路·仿真·半导体
じ☆冷颜〃21 小时前
从确定性算子到随机生成元:谱范式的演进
经验分享·笔记·线性代数·矩阵·抽象代数
日更嵌入式的打工仔21 小时前
RTOS上下文保存
笔记
不吃橘子的橘猫1 天前
《集成电路设计》复习资料4(Verilog HDL概述)
学习·算法·fpga开发·集成电路·仿真·半导体
宇木灵1 天前
C语言基础-五、数组
c语言·开发语言·学习·算法