【计算机视觉CV:标注工具】--ISAT

ISAT（Intelligent Segmentation Annotation Tool） 是由 北京理工大学 & IDEA 实验室 联合开发的一款开源、智能化、高效率的图像分割标注工具 ，专为语义分割、实例分割和全景分割任务设计。

✨ 核心理念："人机协同" ------ 利用前沿 AI 模型（如 SAM）辅助人工标注，将标注效率提升 5～10 倍。

特性	说明
✅ AI 智能辅助	内置 SAM、Grounded-SAM、EfficientSAM 等模型，支持点/框交互式分割
⚡ 标注效率极高	点击几下即可生成精细掩码，告别手动描边
🖼️ 多模态支持	支持 RGB 图像、遥感图、医学影像、工业检测图等
🧩 专业级功能	撤销/重做、图层管理、边缘细化、批量导出
🇨🇳 中文友好	国产工具，中文界面 + 中文文档 + 国内社区支持
💾 离线可用	模型可本地部署，无需联网（适合内网/涉密环境）
📤 格式灵活	直接输出 PNG 掩码、COCO JSON、LabelMe 兼容格式等

python 复制代码

┌───────────────────────┐
│      用户交互界面      │ ← Qt / PyQt5（现代化 UI）
└──────────┬────────────┘
           ↓
┌───────────────────────┐
│   AI 模型调度引擎     │ ← 支持 SAM / Grounded-SAM / EfficientSAM
└──────────┬────────────┘
           ↓
┌───────────────────────┐
│   标注数据管理器      │ ← JSON + PNG 双存储，支持版本回溯
└──────────┬────────────┘
           ↓
┌───────────────────────┐
│   导出模块            │ ← COCO / Pascal VOC / 自定义格式
└───────────────────────┘

1.ISAT--安装

官网源码链接：ISAT

1.1.pip安装

python 复制代码

# create environment
conda create -n isat_env python=3.10

# activate environment
conda activate isat_env



pip install isat-sam


isat-sam

可能需要配置pytorch环境：https://pytorch.org/get-started/locally/?spm=5176.28103460.0.0.460b7551NU4JrN

1.2.源码安装

python 复制代码

# create environment
conda create -n isat_env python=3.8

# activate environment
conda activate isat_env




git clone https://github.com/yatengLG/ISAT_with_segment_anything.git



pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple/


python main.py

2.ISAT--使用

2.1.分割模型下载

预训练模型必须提前下载好，不然等会运行后用不了segment anything功能，只能手动逐个像素点标记。

现在支持 SAM, Sam-HQ, MobileSAM, 及 EdgeSAM 等模型。

1.网址下载

模型分类	预训练模型文件	显存需求	文件大小	模型作用与适用场景	下载链接
SAM	sam_vit_h_4b8939.pth	6462M	2.6G	全能型（高精度）：最原始的 SAM 模型，精度极高，适合对边缘要求极高的科研场景。	官方原链
	sam_vit_l_0b3195.pth	5016M	1.3G	平衡型：精度和速度的平衡点，大多数通用场景的首选。	官方原链
	sam_vit_b_01ec64.pth	3302M	375M	轻量型：速度最快，显存占用最低。适合处理简单物体。	官方原链
SAM-HQ	sam_hq_vit_h.pth	6464M	2.6G	去噪型（推荐）：修复了原版噪点，边缘更平滑，适合精细标注。	HuggingFace
	sam_hq_vit_l.pth	5016M	1.3G	HQ 平衡版： HQ 系列的折中选择。	HuggingFace
	sam_hq_vit_b.pth	3304M	379M	HQ 轻量版： HQ 系列中速度最快的。	HuggingFace
	sam_hq_vit_tiny.pth	598M	43M	极低配版：仅用于测试或显存极小的设备。	HuggingFace
Mobile-SAM	mobile_sam.pt	534M	40M	极速版：速度极快，精度尚可，适合数据初筛。	HuggingFace
Edge-SAM	edge_sam.pth	360M	38.8M	边缘计算版：适合 CPU 运行，GPU 上优势不大。	GitHub
	edge_sam_3x.pth	360M	38.8M	Edge-SAM 放大版：解码器放大了 3 倍。	GitHub
SAM-Med	sam-med2d_b.pth	1500M	2.4G	医学专用：专为医学影像（CT/MRI）训练。	官方原链
SAM2	sam2_hiera_large.pt	4000M	900M	视频流版：支持视频分割，解决 `sam_video_tag` 报错。	HuggingFace
	sam2_hiera_base_plus.pt	4000M	324M	SAM2 标准版：基础视频/图像模型。	HuggingFace
	sam2_hiera_small.pt	3000M	185M	SAM2 轻量版：适合快速视频处理。	HuggingFace
	sam2_hiera_tiny.pt	2400M	156M	SAM2 极速版：视频处理首选，速度快。	HuggingFace
SAM3	sam3.pt	待定	待定	下一代（假设）：用于测试新架构兼容性或未来升级占位。	[假设链接] `https://huggingface.co/your_repo/sam3/resolve/main/sam3.pt`

2.界面下载

下载完成之后，使用那个模型就点那个，然后终端会显示是否加载成功：

2.2.添加分类

还可以导入提前准备好的类名，类名信息存放在.yaml文件中，yaml文件中存放内容及格式见下:

默认保存位置：

2.3.自动保存

建议开启自动保存，避免打标签过程出现意外中断无法保存，开启方法如下：

2.4.加载图片

载入图像文件

注：待标记的图像必须是三通道图，灰度图像会报错，是因为SAM中的官网模型都是针对三通道图像训练得到的模型，如果非得标记灰度图，可以先通过cv2.COLOR_GRAY2BGR转换一下再标记，标记完成后，如果深度学习训练想喂入单通道图，再用原来的灰度图。

标签保存位置：

2.5.开始标记

这里的键只是默认单字母：

1.Q：sam点提示：

2.W: sam框提示：

3.C：多边形，

输出的默认是json数据：

python 复制代码

{
    "info": {
        "description": "ISAT",
        "folder": "C:/Users/28986/Desktop/专栏图片",
        "name": "033a01af-03cf-42f7-8e5e-01ef7d84e207.png",
        "width": 1024,
        "height": 1024,
        "depth": 3,
        "note": ""
    },
    "objects": [
        {
            "category": "好人一号",
            "group": 1,
            "segmentation": [
                [
                    574.0,
                    55.0
                ],
                [
                    569.0,
                    63.0
                ],
                [
                    569.0,
                    67.0
                ],
                [
                    568.0,
                    68.0
                ],
                [
                    568.0,
                    96.0
                ],
                [
                    567.0,
                    97.0
                ],
                [
                    567.0,
                    124.0
                ],
                [
                    568.0,
                    125.0
                ],
                [
                    568.0,
                    132.0
                ],
                [
                    570.0,
                    139.0
                ],
                [
                    570.0,

2.6.数据转换

例如：下面选择.json文件路径，和选择转为VOC格式后要保存的路径，如下：