Gemini写的抠图工具

侯孟禹2026-02-06 9:05

工具地址（没有打包成软件）：https://github.com/hou080146/RailFOD-Dataset-Generator

项目有个需求：检测某区域内有没有特定物品

问题：检测的场景有特殊性，需要通过图像增强造数据集

解决方法：通过抠图把公开数据集中的需要检测的物品抠出来，然后通过图像增强贴到场景中

花了10分钟让Gemini写了个工具，调用Facebook的SAM 2分割模型，使用opencv对物品进行抠图保存

单纯的调用opencv，没有任何UI界面和其他功能。由于我平时又使用Qt开发界面，就想着把他直接做成一个实用工具，又花了几个小时让Gemini修改成PyQt5的工具。

跟anythinglabel一样，直接在点击要抠的物品，绿色遮罩就是抠取的范围。按键S保存并下一张，空格键跳过当前图片

抠图效果

上一篇：uniapp+h5 公众号实现分享海报绘制

下一篇：Kubernetes 网络问题排查：在宿主机对 Pod 抓包（nsenter + tcpdump 实战）

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结