Gemini写的抠图工具

工具地址(没有打包成软件):https://github.com/hou080146/RailFOD-Dataset-Generator

项目有个需求:检测某区域内有没有特定物品

问题:检测的场景有特殊性,需要通过图像增强造数据集

解决方法:通过抠图把公开数据集中的需要检测的物品抠出来,然后通过图像增强贴到场景中

花了10分钟让Gemini写了个工具,调用Facebook的SAM 2分割模型,使用opencv对物品进行抠图保存

单纯的调用opencv,没有任何UI界面和其他功能。由于我平时又使用Qt开发界面,就想着把他直接做成一个实用工具,又花了几个小时让Gemini修改成PyQt5的工具。

跟anythinglabel一样,直接在点击要抠的物品,绿色遮罩就是抠取的范围。按键S保存并下一张,空格键跳过当前图片

抠图效果

相关推荐
Lynn_mg2 小时前
Opencv,contrib安装
人工智能·opencv·计算机视觉
2301_803554523 小时前
qt信号槽机制以及底层实现原理
开发语言·qt
笨笨马甲3 小时前
Qt 音视频编解码
开发语言·qt
sali-tec3 小时前
C# 基于OpenCv的视觉工作流-章38-BF特征匹配
图像处理·人工智能·opencv·算法·计算机视觉
总有刁民想爱朕ha5 小时前
OpenCV 图像操作入门:从零开始玩转计算机视觉
人工智能·opencv·计算机视觉
进击ing小白6 小时前
OpenCv之图像的仿射和透视变化
人工智能·opencv·机器学习
笨笨马甲8 小时前
Qt 嵌入式开发快速搭建交叉编译环境
开发语言·qt
Lhan.zzZ8 小时前
Qt绘图探秘:如何避免多QPainter冲突引发的程序崩溃
开发语言·c++·qt
不懒不懒8 小时前
【实战 OpenCV 身份证号码识别】
人工智能·opencv·计算机视觉
Westward-sun.9 小时前
OpenCV图像透视变换:自动矫正倾斜的发票
人工智能·opencv·计算机视觉