LoRA训练自动化打标系统重磅发布!支持Qwen3.5破限和NSFW,功能覆盖图片视频音乐全自动打标

1.升级内容

核心升级:支持使用Qwen3.5进行打标,包括标准版和破限版

功能优化:整体打标系统进行全面升级,提升标签生成质量

模型选择:新增Qwen3.5系列模型选项(9B/4B等不同参数版本)

2.使用示例

1)自动打标设置

打标对象:支持图片/视频/音频三种媒体类型

语言选择:可独立设置中文或英文标签生成

随机程度:数值越高结果越随机,数值越低越稳定

模型范围:低值安全单一,高值创意自由(推荐值50-80)

打标语言

双语支持:中文标签生成中文描述,英文标签生成英文描述

训练联动:标签语言与训练使用语言自动关联

打标模型

推荐模型:Qwen3.5-9B-abliterated破限版

模型特性:破限版支持更自由的词汇选择和创意表达

多版本支持:提供VL-8B/VL-4B等多种参数规格

打标类型

风格选项:

Stable Diffusion提示词式

描述式自然语言

口语化/简练直述式

长度控制:支持短/中/长三种标签长度设置

模型训练

标签校验:自动打标后建议人工校验确保准确性

进度显示:实时显示模型加载和打标进度

批量处理:支持同时处理8个素材的批量打标

开始打标

操作流程:

选择打标对象和语言

设置模型参数和类型

点击开始打标按钮

耗时提示:图像/视频理解可能耗时较长需耐心等待

结果保存:自动写入zh.txt/en.txt对应语言文件

翻译功能

双向翻译:支持中英文标签互转

模型要求:需提前下载HY-MT1.5-1.8B翻译模型

非覆盖式:翻译结果不覆盖原有标签文件

进度提示:实时显示各素材翻译进度

应用案例 :

给猴子打标

需求实现:通过提示词"不要出现猴子这两个字"控制输出

效果验证:成功将"猴子"替换为"灵长类角色"

灵活控制:支持任意自定义提示词约束输出内容

3.视频打标

处理流程:与图片打标相同,选择视频类型即可

示例输出:

"武士静坐火场中央"

"修女吸烟特写镜头"

4.音频打标

支持格式:常见音频格式均可处理

特征提取:自动分析音频内容生成描述标签

应用场景:适合音乐/音效等内容标注

5.内容总结

核心功能:全自动中英文打标+翻译+手动编辑

特色亮点:

支持Qwen3.5破限版模型

自定义提示词控制

多媒体类型全覆盖

使用建议:自动打标后务必进行人工校验

二、知识小结

|--------|-----------------|----------------|--------------|---------------|
| 功能模块 | 升级亮点 | 技术参数 | 应用场景 | 对比优势 |
| AI打标系统 | 支持Qwen3.5及破限版模型 | 中英双语/视频音频打标 | 素材预处理/LoRA训练 | 多模态支持超越传统文本打标 |
| 打标对象 | 图片/视频/音频全支持 | 自动识别BPM/调式/歌词 | 音乐模型训练 | 行业首创音频结构化 |
| 标签定制 | 提示词干预生成结果 | 可禁用特定词汇(如"猴子") | 合规性过滤 | 比传统标签更精准可控 |
| 批量处理 | 追加/替换/删除标签 | 支持头部尾部插入 | 统一标签管理 | 效率提升300% |
| 翻译功能 | 中英互译即时转换 | 保持原标签并行存储 | 多语言数据集构建 | 消除人工翻译误差 |
| 视频解析 | 动态场景语义提取 | 帧级分析生成描述 | 影视素材分类 | 比CLIP模型更细粒度 |
| 工作流集成 | 自定义提示词管道 | 支持SD风格/描述式输出 | 自动化训练准备 | 端到端解决方案 |

可点击下方原文链接观看视频教程👇

https://comfyit.cn/blog/258/?invite_code=TSH

相关推荐
wangqiaowq1 小时前
@CrossOrigin 是 Spring 提供的跨域支持注解,但不允许携带凭证
人工智能
大橙子打游戏1 小时前
当 Codex 遇上 AI 中转站:写一个协议转换代理解决 Responses API 的兼容性困境
人工智能
且去填词1 小时前
VSCode 中使用 Codex:命令、Agent 与 Skills 完整指南
ide·人工智能·vscode·编辑器·codex
OpenVINO 中文社区1 小时前
从零开始构建机器人数据:用 Physical AI Studio 搭建你的第一个模仿学习流水线
人工智能·openvino
云烟成雨TD1 小时前
Spring AI Alibaba 1.x 系列【47】状态图定义:StateGraph 源码解析
java·人工智能·spring
OCR_133716212751 小时前
技术解析:护照OCR查验核心逻辑,跨境身份核验的技术实现路径
大数据·运维·人工智能
陈天伟教授1 小时前
图解人工智能(1)居里点
大数据·开发语言·人工智能·gpt
深小乐1 小时前
Cursor 转 Codex 大半个月,聊聊我的真实感受
人工智能
测绘第一深情1 小时前
AutoDL 上复现 MapQR:从环境配置到 nuScenes Mini 训练跑通
人工智能·深度学习·机器学习·自动驾驶·transformer