图像描述编辑器 (Image Caption Editor)

YujunCui/ImageCaptionEditor: A graphical interface tool for editing image-text pair data, supporting two data formats: image_json_pair format and message format.https://github.com/YujunCui/ImageCaptionEditor一个用于编辑图像-文本对数据的图形界面工具,支持两种数据格式:image_json_pair格式和message格式。

如果有帮助到大家,请多多点赞!

功能特点

  • 支持两种数据格式:

    • image_json_pair格式:每个图像文件对应一个同名的JSON文件,JSON文件中包含图像描述信息

    • message格式:一个JSON文件包含多个图像描述条目,每个条目可以引用多个图像文件

  • 多语言界面支持(中文/英文)

  • 图像预览功能,支持缩放

  • 文本编辑区域,支持JSON格式的描述编辑

  • 导航功能:支持前后浏览、跳转到指定图像

  • 键盘快捷键支持,提高操作效率

界面介绍

主要组件

  1. 左侧控制面板

    • 语言选择:支持中英文界面切换

    • 模式选择:选择数据格式(image_json_pair或message)

    • 目录设置:选择包含数据的目录

    • 图像导航:前后浏览图像,跳转到指定图像

    • 文本编辑:进入编辑模式

    • 信息显示:显示图像总数等信息

  2. 右侧显示区域

    • 图像预览区域:显示当前图像,支持缩放

    • 文本编辑区域:显示和编辑图像描述的JSON数据

使用方法

数据格式说明

image_json_pair格式

该格式要求每个图像文件都有一个对应的同名JSON文件,例如:

复制代码
data/
├── image1.jpg
├── image1.json
├── image2.png
└── image2.json

其中JSON文件内容格式如下:

复制代码
[
  {
    "vision_path": "D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg",
    "answer": "一对情侣在户外,互相嬉闹,背景有树木和蓝天。"
  }
]
message格式

该格式使用一个JSON文件包含所有图像描述信息:

复制代码
[
  {
    "messages": [
      {
        "content": "<image>请简短描述图片内容。",
        "role": "user"
      },
      {
        "content": "一对情侣在户外互相嬉闹,背景有树木和蓝天。",
        "role": "assistant"
      }
    ],
    "images": [
      "D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg"
    ]
  },
  {
    "messages": [
      {
        "content": "<image>请简短描述图片内容。",
        "role": "user"
      },
      {
        "content": "四人围成一圈,用竹竿互相推搡。",
        "role": "assistant"
      }
    ],
    "images": [
      "D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\71a046b26d52218a15be3fecc938f246.jpeg"
    ]
  }
]

操作指南

  1. 选择数据目录

    • 点击"选择目录"按钮,选择包含图像和JSON文件的目录
  2. 浏览图像

    • 使用"第一张"、"上一张"、"下一张"、"最后一张"按钮导航

    • 使用键盘快捷键:Home(第一张)、End(最后一张)、F(下一张)、D(上一张)

    • 在跳转输入框中输入序号直接跳转到指定图像

  3. 查看图像

    • 图像会自动显示在左侧预览区域

    • 使用鼠标滚轮上下滚动查看多张图像

    • 使用Ctrl+鼠标滚轮进行图像缩放,但是图像会被限制在图像预览区域

  4. 编辑描述

    • 点击"编辑文本"按钮或按E键进入编辑模式

    • 在文本编辑区域修改JSON格式的描述内容

    • 按Ctrl+S保存修改,或按Esc取消编辑

    • 点击"保存修改"按钮确认保存,或点击"退出编辑"按钮放弃修改

  5. 界面语言切换

    • 在"Language / 语言"选项中选择English或中文

快捷键列表

快捷键 功能
Ctrl+S 保存修改
Ctrl+Z 撤销
Ctrl+Y 重做
Esc 退出编辑模式
E 进入编辑模式
F 下一张图像
D 上一张图像
Home 第一张图像
End 最后一张图像
Ctrl+鼠标滚轮 图像缩放
Ctrl+0 重置图像缩放

注意事项

  1. 确保JSON文件格式正确,否则可能导致程序出错

  2. 图像文件和JSON文件需要正确对应

  3. 在message格式中,图像路径可以是绝对路径或相对于JSON文件的相对路径

  4. 编辑时请保持JSON格式的正确性,否则无法保存

  5. 程序会自动保存每张图片的缩放状态,方便再次查看时保持相同的缩放比例

  6. 程序在处理大量数据时可能会卡顿,请分批处理

相关推荐
AI小百科15 小时前
开源AI编辑器的未来发展趋势
人工智能·编辑器
技术探讨者19 小时前
极境导表工具 —— 让配置数据成为游戏开发的效率引擎
unity·编辑器·ai编程·游戏策划
AI小百科20 小时前
目前开源AI编辑器面临的主要挑战是什么
人工智能·开源·编辑器
爱吃龙利鱼20 小时前
MobaXterm连接ubuntu26.04无法在vim界面粘贴问题解决方法(粘贴会提示进入进入可视模式VISUAL))
linux·ubuntu·编辑器·vim
秋921 小时前
Cursor 编辑器:下载、安装与深度使用详解
编辑器
小则又沐风a1 天前
一步搞定Xshell远程连接vscode的问题
ide·vscode·编辑器
Codiggerworld2 天前
Vim配置从0到1:打造专属编辑器
编辑器·vim·excel
lqj_本人2 天前
鸿蒙electron跨端框架PC青简笔记实战:从笔记列表、编辑器到桌面导出,一次做完整
笔记·编辑器
图像僧2 天前
没有sudo权限也能安装和使用 VSCode
ide·vscode·编辑器
咬人喵喵2 天前
E2编辑器里的零高容器是什么?怎么用?
低代码·微信·编辑器·交互·svg