大型视觉语言模型下的异常链思维

深度强化学习 / 强化学习培训 / 数字孪生培训 / 大模型培训 / 智能体培训 / 具身智能培训

基于大型视觉语言模型的自动化视频监控,因其固有的常态偏向性而受限,常常无法有效识别犯罪行为。尽管思维链推理策略在语言任务中展现出显著改进性能的潜力,但其推理过程中缺乏归纳性异常偏差,进一步将模型导向正常化解读。为此,我们提出异常思维链(Chain-of-Anomaly-Thoughts,简称CoAT)------一种多智能体推理框架,该框架通过最终聚焦异常的分类层,在推理过程中引入归纳性犯罪偏差。我们的方法显著提升了异常检测性能,在低分辨率监控视频中将F1分数提高了11.8个百分点;在高分辨率视频的异常分类任务中,性能也提升了3.78个百分点。

大型视觉语言模型在自动化视频监控中存在固有的"常态偏向",常导致犯罪行为漏检。为解决此问题,研究者提出了异常链思维(Chain-of-Anomaly-Thoughts, CoAT) 框架。该方法通过引入多智能体推理架构,在思维链中显式嵌入归纳性犯罪偏差,并设置异常导向的最终分类层,从而主动引导模型识别非常规线索。实验表明,CoAT显著提升了模型在复杂监控场景下的感知能力:在低分辨率视频中异常检测F1分数提升11.8%,高分辨率视频中异常分类精度提升3.78%。该研究为突破大模型在安防领域的认知局限提供了可解释的推理路径。

原文链接:https://arxiv.org/html/2512.20417v1

相关推荐
哈__24 分钟前
CANN图优化技术:深度学习模型的编译器魔法
人工智能·深度学习
灰灰勇闯IT25 分钟前
神经网络的基石——深度解析 CANN ops-nn 算子库如何赋能昇腾 AI
人工智能·深度学习·神经网络
秋邱27 分钟前
深度解析CANN与AIGC的核心联系:算力底座赋能生成式AI规模化落地
人工智能·aigc
一枕眠秋雨>o<28 分钟前
数学的底座:ops-math如何为AI计算注入确定性
人工智能
Henry-SAP32 分钟前
SAP(ERP)主要生产计划(MPS)业务视角解析
人工智能
猫头虎35 分钟前
2026年AI产业13大趋势预测:Vibe Coding创作者经济元年到来,占冰强专家解读AIGC未来图景
人工智能·开源·prompt·aigc·ai编程·远程工作·agi
程序员清洒35 分钟前
CANN模型部署:从云端到端侧的全场景推理优化实战
大数据·人工智能
deephub35 分钟前
LLM推理时计算技术详解:四种提升大模型推理能力的方法
人工智能·深度学习·大语言模型·推理时计算
lili-felicity39 分钟前
CANN性能调优与实战问题排查:从基础优化到排障工具落地
开发语言·人工智能
User_芊芊君子43 分钟前
HCCL高性能通信库编程指南:构建多卡并行训练系统
人工智能·游戏·ai·agent·测评