TANDEM:多模态仇恨言论的时间感知神经检测

社交媒体平台日益被长篇幅多模态内容主导,有害信息常通过音频、视觉与文本线索的复杂交织构建。尽管自动化系统能以高精度识别仇恨言论,但其"黑箱"特性往往无法提供人类参与审核所需的细粒度、可解释证据------如精确时间戳和攻击目标身份。

本研究提出TANDEM框架,将视听仇恨检测从二元分类任务转化为结构化推理问题。该框架采用创新的协同强化学习策略,通过视觉-语言与音频-语言模型在自约束跨模态语境中相互优化,实现对长时序内容的稳定推理,无需密集帧级标注。

在三个基准数据集上的实验表明,TANDEM显著超越零样本与上下文增强基线,在HateMM数据集的目标识别任务中达到0.73 F1值(较前沿方法提升约30%),同时保持精准时间定位。

我们发现,虽然二元检测稳健,但在多分类场景中区分冒犯性与仇恨内容仍具挑战,这源于固有的标签模糊性与数据集不平衡。总体而言,本研究表明即使面对复杂多模态场景,结构化可解释的对齐仍可实现,为下一代透明、可操作的在线安全审核工具提供了蓝图。

我们提出了TANDEM------一个用于结构化多模态仇恨理解的协同强化学习框架,它联合优化视觉-语言与音频-语言模型。通过将监督微调与自约束上下文轮次、奖励引导的策略优化相结合,TANDEM在仇恨分类、时间定位和目标识别任务上实现了一致性提升。在HateMM、MultiHateClip和ImpliHateVid数据集上的大量实验表明,尽管强大的零样本和上下文增强基线在粗粒度分类上表现优异,但在生成具有时间定位和目标感知的预测方面仍存在局限。相比之下,TANDEM能够产生更稳健且可解释的结构化输出,缩小了不同数据集之间的性能差距,并在HateMM数据集上实现了目标识别任务0.73的F1分数。

我们的消融研究揭示了三个关键发现。首先,监督微调提供了必要的结构先验,但对于学习细粒度时间定位仍不充分。其次,强化学习仅在受到结构化跨模态上下文(如SCCR所提供的)约束时才有效。第三,协同优化对于防止模态漂移和确保一致的跨模态对齐至关重要。这些发现共同验证了TANDEM是一个统一框架,而非独立组件的简单集合。

未来工作仍有多个方向值得探索。首先,用令牌标识符(令牌输入-令牌输出)替代基于字符串的输入输出,有望显著提升强化学习的稳定性,尤其对于视觉-语言和音频-语言模型而言。其次,将跨模态上下文扩展至单个视频片段之外,并利用更大的LoRA参数预算,可能在更高计算资源的支持下进一步增强长时序推理能力。第三,直接通过强化学习对全模态模型进行微调仍是一个开放挑战,这需要改进Hugging Face库的支持并解决当前的技术瓶颈。最后,提升数据集质量------特别是通过厘清冒犯性与仇恨性标签之间的固有模糊性,并增加少数类别的覆盖度------对于减少偏见、提升多类别仇恨理解的鲁棒性至关重要。

相关推荐
飞哥数智坊7 小时前
我的“龙虾”罢工了!正好对比下GLM、MiniMax、Kimi 3家谁更香
人工智能
风象南8 小时前
很多人说,AI 让技术平权了,小白也能乱杀老师傅 ?
人工智能·后端
董董灿是个攻城狮9 小时前
大模型连载1:了解 Token
人工智能
RoyLin12 小时前
沉睡三十年的标准:HTTP 402、生成式 UI 与智能体原生软件的时代
人工智能
needn14 小时前
TRAE为什么要发布SOLO版本?
人工智能·ai编程
毅航14 小时前
自然语言处理发展史:从规则、统计到深度学习
人工智能·后端
前端付豪14 小时前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
ursazoo15 小时前
写了一份 7000字指南,让 AI 帮我消化每天的信息流
人工智能·开源·github
_志哥_18 小时前
Superpowers 技术指南:让 AI 编程助手拥有超能力
人工智能·ai编程·测试
YongGit19 小时前
OpenClaw 本地 AI 助手完全指南:飞书接入 + 远程部署实战
人工智能