【论文记录】Boosting Detection in Crowd Analysis via Underutilized Output Features

Boosting Detection in Crowd Analysis via Underutilized Output Features

Abstract

Crowd Hat使用一种混合的2D-1D压缩技术进行细化空间特征与获取特定人群信息的空间和数量分布。进一步的,Crowd Hat采用自适应区域的NMS阈值与一个解耦然后对齐的范式来解决基于检测方法的缺陷。

Methodology

作者认为检测得到预测的Bounding Boxes和Proposals包含丰富的特定人群信息。作者采用检测结果的区域尺寸和置信度分数。他认为这些特征对于人群分析是Pure。

Output Feature Compression

直接把检测结果的中心坐标映射到输入图片上,得到的生成特征图存在着预测的Bounding Boxes和Proposals数量远小于图片中像素的数量,会导致特征图过于稀疏无法传递关键信息。

作者提出了一种混合的2D-1D压缩方法进一步细化输出特征,获得这些特定人群信息的空间和数量分布。

2D Compression

作者首先根据Proposal或者Bounding Box的中心坐标把他们映射到输入图片上,然后把图片分成S×S个Patches,将Patches的元素相加获得压缩矩阵M中的相应元素。

1D Compression

1D压缩用来寻找输出特征的数值分布。例如一个低的输出Bounding box area sizes分布可能暗示一个很高的人群密度。

首先,作者正则化置信度分数和区域尺寸值到[0,1]区间。然后将区间分成L个间隔。最后,计算落入每个区间值的数量。


Crowd Hat Network

把2D压缩矩阵堆叠成t2d,把1D压缩矩阵堆叠成t1d

Region-Adaptive NMS Decoder

将全局特征与局部特征进行连接,然后输入到MLP中,生成region-adaptive NMS阈值。

Decouple-then-Align Paradigm

作者通过直接使用全局特征回归人群数量,对模型的检测过程与计数过程进行了解耦,使用一个独立的MLP作为Count Decoder PC去预测人群数量。

将Bounding Boxes与Count中值小的且置信度高的作为最终结果。

Summary

本文的主要思想是通过Proposals和Bounding Boxes获取特定人群的空间信息和数值信息,根据这些信息学习自适应的NMS阈值与人群数量。

相关推荐
所谓伊人,在水一方333几秒前
【机器学习精通】第2章 | 优化算法深度解析:从梯度下降到自适应优化器
人工智能·python·算法·机器学习·信息可视化
熊猫钓鱼>_>2 分钟前
使用阿里云轻量应用服务器OpenClaw丝滑接入飞书打造智能群聊总结助手
人工智能·阿里云·云计算·飞书·agent·skill·openclaw
zhangfeng11332 分钟前
BW/昆仑芯 国产GPU 上面微调模型 lora 异构GPU DPUPaddlePaddle/PaddleNLP 完全支持 ,unsloth似乎不支持
人工智能·编辑器
Rorsion4 分钟前
机器学习基本步骤与模型优化思路
人工智能·机器学习
所谓伊人,在水一方3337 分钟前
【机器学习精通】第3章 | 正则化与泛化:防止过拟合的理论与实践
开发语言·人工智能·机器学习·信息可视化·系统架构
沃达德软件7 分钟前
视频监控烟火识别技术
图像处理·人工智能·目标检测·计算机视觉·目标跟踪·视觉检测·超分辨率重建
TMT星球7 分钟前
火星人携双白皮书亮相AWE 2026,定义厨房空间重构新坐标
大数据·人工智能·重构
坚持学习前端日记7 分钟前
Agent AI 后端接口对接与大模型适配指南
前端·人工智能·python·ios
SEO_juper7 分钟前
AI时代的SEO重构:从搜索排名到AI可见度的底层逻辑变革
人工智能·ai·chatgpt·重构·seo·数字营销·2026
不懒不懒9 分钟前
【Opencv计算机视觉-模版匹配】
人工智能·opencv·计算机视觉