大型视觉语言模型下的异常链思维

深度强化学习 / 强化学习培训 / 数字孪生培训 / 大模型培训 / 智能体培训 / 具身智能培训

基于大型视觉语言模型的自动化视频监控,因其固有的常态偏向性而受限,常常无法有效识别犯罪行为。尽管思维链推理策略在语言任务中展现出显著改进性能的潜力,但其推理过程中缺乏归纳性异常偏差,进一步将模型导向正常化解读。为此,我们提出异常思维链(Chain-of-Anomaly-Thoughts,简称CoAT)------一种多智能体推理框架,该框架通过最终聚焦异常的分类层,在推理过程中引入归纳性犯罪偏差。我们的方法显著提升了异常检测性能,在低分辨率监控视频中将F1分数提高了11.8个百分点;在高分辨率视频的异常分类任务中,性能也提升了3.78个百分点。

大型视觉语言模型在自动化视频监控中存在固有的"常态偏向",常导致犯罪行为漏检。为解决此问题,研究者提出了异常链思维(Chain-of-Anomaly-Thoughts, CoAT) 框架。该方法通过引入多智能体推理架构,在思维链中显式嵌入归纳性犯罪偏差,并设置异常导向的最终分类层,从而主动引导模型识别非常规线索。实验表明,CoAT显著提升了模型在复杂监控场景下的感知能力:在低分辨率视频中异常检测F1分数提升11.8%,高分辨率视频中异常分类精度提升3.78%。该研究为突破大模型在安防领域的认知局限提供了可解释的推理路径。

原文链接:https://arxiv.org/html/2512.20417v1

相关推荐
亿电连接器替代品网18 小时前
Bulgin连接器在自动化与能源系统中的应用及国产替代策略
大数据·网络·人工智能·经验分享·物联网·硬件工程·材料工程
Tutankaaa1 天前
从被动接受到主动挑战:知识竞赛如何重塑学习价值
人工智能·经验分享·笔记·学习
Jmayday1 天前
机器学习基本理论
人工智能·机器学习
ZhengEnCi1 天前
01b-上下文向量与信息瓶颈
人工智能
王_teacher1 天前
机器学习 矩阵求导 完整公式+严谨推导
人工智能·线性代数·考研·机器学习·矩阵·线性回归
码以致用1 天前
DeerFlow Memory架构
人工智能·ai·架构·agent
ting94520001 天前
从零构建大模型实战:数据处理与 GPT-2 完整实现
人工智能
学点程序1 天前
Manifest:帮个人 AI Agent 降低模型成本的开源路由器
人工智能·开源
可观测性用观测云1 天前
观测云 x AI Agent:运维智能化的范式跃迁实践
人工智能
数数科技的数据干货1 天前
ThinkingAI携手华为云,共建企业级AI Agent平台Agentic Engine
人工智能·ai·华为云·agent