工具地址(没有打包成软件):https://github.com/hou080146/RailFOD-Dataset-Generator
项目有个需求:检测某区域内有没有特定物品
问题:检测的场景有特殊性,需要通过图像增强造数据集
解决方法:通过抠图把公开数据集中的需要检测的物品抠出来,然后通过图像增强贴到场景中
花了10分钟让Gemini写了个工具,调用Facebook的SAM 2分割模型,使用opencv对物品进行抠图保存
单纯的调用opencv,没有任何UI界面和其他功能。由于我平时又使用Qt开发界面,就想着把他直接做成一个实用工具,又花了几个小时让Gemini修改成PyQt5的工具。

跟anythinglabel一样,直接在点击要抠的物品,绿色遮罩就是抠取的范围。按键S保存并下一张,空格键跳过当前图片

抠图效果