LoRA训练自动化打标系统重磅发布!支持Qwen3.5破限和NSFW,功能覆盖图片视频音乐全自动打标

1.升级内容

核心升级:支持使用Qwen3.5进行打标,包括标准版和破限版

功能优化:整体打标系统进行全面升级,提升标签生成质量

模型选择:新增Qwen3.5系列模型选项(9B/4B等不同参数版本)

2.使用示例

1)自动打标设置

打标对象:支持图片/视频/音频三种媒体类型

语言选择:可独立设置中文或英文标签生成

随机程度:数值越高结果越随机,数值越低越稳定

模型范围:低值安全单一,高值创意自由(推荐值50-80)

打标语言

双语支持:中文标签生成中文描述,英文标签生成英文描述

训练联动:标签语言与训练使用语言自动关联

打标模型

推荐模型:Qwen3.5-9B-abliterated破限版

模型特性:破限版支持更自由的词汇选择和创意表达

多版本支持:提供VL-8B/VL-4B等多种参数规格

打标类型

风格选项:

Stable Diffusion提示词式

描述式自然语言

口语化/简练直述式

长度控制:支持短/中/长三种标签长度设置

模型训练

标签校验:自动打标后建议人工校验确保准确性

进度显示:实时显示模型加载和打标进度

批量处理:支持同时处理8个素材的批量打标

开始打标

操作流程:

选择打标对象和语言

设置模型参数和类型

点击开始打标按钮

耗时提示:图像/视频理解可能耗时较长需耐心等待

结果保存:自动写入zh.txt/en.txt对应语言文件

翻译功能

双向翻译:支持中英文标签互转

模型要求:需提前下载HY-MT1.5-1.8B翻译模型

非覆盖式:翻译结果不覆盖原有标签文件

进度提示:实时显示各素材翻译进度

应用案例 :

给猴子打标

需求实现:通过提示词"不要出现猴子这两个字"控制输出

效果验证:成功将"猴子"替换为"灵长类角色"

灵活控制:支持任意自定义提示词约束输出内容

3.视频打标

处理流程:与图片打标相同,选择视频类型即可

示例输出:

"武士静坐火场中央"

"修女吸烟特写镜头"

4.音频打标

支持格式:常见音频格式均可处理

特征提取:自动分析音频内容生成描述标签

应用场景:适合音乐/音效等内容标注

5.内容总结

核心功能:全自动中英文打标+翻译+手动编辑

特色亮点:

支持Qwen3.5破限版模型

自定义提示词控制

多媒体类型全覆盖

使用建议:自动打标后务必进行人工校验

二、知识小结

|--------|-----------------|----------------|--------------|---------------|
| 功能模块 | 升级亮点 | 技术参数 | 应用场景 | 对比优势 |
| AI打标系统 | 支持Qwen3.5及破限版模型 | 中英双语/视频音频打标 | 素材预处理/LoRA训练 | 多模态支持超越传统文本打标 |
| 打标对象 | 图片/视频/音频全支持 | 自动识别BPM/调式/歌词 | 音乐模型训练 | 行业首创音频结构化 |
| 标签定制 | 提示词干预生成结果 | 可禁用特定词汇(如"猴子") | 合规性过滤 | 比传统标签更精准可控 |
| 批量处理 | 追加/替换/删除标签 | 支持头部尾部插入 | 统一标签管理 | 效率提升300% |
| 翻译功能 | 中英互译即时转换 | 保持原标签并行存储 | 多语言数据集构建 | 消除人工翻译误差 |
| 视频解析 | 动态场景语义提取 | 帧级分析生成描述 | 影视素材分类 | 比CLIP模型更细粒度 |
| 工作流集成 | 自定义提示词管道 | 支持SD风格/描述式输出 | 自动化训练准备 | 端到端解决方案 |

可点击下方原文链接观看视频教程👇

https://comfyit.cn/blog/258/?invite_code=TSH

相关推荐
武子康1 小时前
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排
人工智能·langchain·llm
武子康2 小时前
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)
人工智能·openai·claude
aqi002 小时前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
混沌福王4 小时前
Electron三端统一架构:运行时Adapter、IPC能力边界与分层设计
人工智能·agent·ai编程
说了很好4 小时前
马尔可夫扩散链+损失函数推导,手把手实现原生Diffusion
人工智能
聂二AI落地内参4 小时前
合同抽取别停在 JSON:标准规则和交易日历才是硬仗
人工智能
冬哥聊AI4 小时前
滴滴Agent岗二面:RAG 系统的 LLM 幻觉怎么治?从两类根源讲到四道防线
人工智能
lyshlc4 小时前
# AI Agent的推迟判定协议:不确定性下的最优策略
人工智能
用户329901675054 小时前
用zod在运行时兜住AI返回的JSON
人工智能