计算机视觉：城市公共空间多主体行为计算

本文基于发表于2025年的研究论文，聚焦于利用先进的计算机视觉技术，解决城市公共空间中"多主体"（即不同类型人群，如儿童与家长）行为交互的精细化量化分析难题。

一、背景与问题

当前，针对"一老一小"的公共空间精细化设计成为重要议题。传统的空间行为研究方法存在明显瓶颈：

人工观察法：虽能区分人群类型，但耗时耗力，难以进行大规模、长时间的数据采集与分析。
通用计算机视觉方法 ：基于YOLO、DeepSORT等算法实现了自动化行为追踪，但通常将空间中所有人视为一个同质群体，无法自动甄别不同人群类型（如儿童与成人）。

这导致了一个关键的研究空白：我们难以高效、精准地揭示不同人群之间（而非整体人群）的复杂行为交互规律，以及空间形态如何影响这些交互。本文的核心目标，就是构建一套能够自动识别、追踪并分析特定人群（多主体）行为交互的计算分析方法。

二、研究方法：技术框架

论文提出的"基于定向视觉追踪的多主体行为计算分析方法"是一个完整的技术流程，包含四个核心步骤：

第一步：数据采集与预处理

工具：使用狩猎相机进行非介入式、长时间的视频录制。
关键参数 ：通过实验确定10-30Hz的帧率范围，在数据连续性与计算效率间取得平衡。

第二步：基于图像识别的多目标行人追踪

算法组合 ：采用 YOLOX（目标检测） + ByteTrack（多目标追踪） 的组合。ByteTrack算法在多目标追踪准确率（MOTA）上表现优异，能在复杂场景中稳定追踪多人轨迹。
坐标转换 ：引入逆透视变换（IPM） 算法，将视频中2D像素坐标转换为现实世界的3D空间坐标。这是将图像数据转化为可度量空间行为数据的关键一步。

第三步：基于特征识别模型的人群类型甄别（本方法的核心创新）

在公共空间尺度，人脸、步态等微观特征难以获取。本文提出了一个巧妙且实用的解决方案：

识别特征 ：利用人体 bounding box（检测框）的高宽比作为甄别特征。
阈值设定 ：设定儿童的高宽比范围为1:1 ~ 2:1 ，成人的高宽比范围为3:1 ~ 4:1。这是基于儿童与成人体型比例的显著差异。
机制：在追踪过程中，算法根据设定比例范围，自动过滤和归类追踪目标，从而分别输出"儿童"和"家长"两组行为轨迹数据。该方法经与人工标注对比，验证了其准确性。

第四步：多主体行为指标计算与可视化分析

基于分离后的轨迹数据，计算三类核心指标，并将其可视化为空间热力图：

区域内人群平均距离 ：反映聚集程度。平均距离越小，人群越密集，社交可能性越高。
区域内驻留时长 ：反映静态使用率。累计停留时间越长，说明该区域对驻足、休息、看护等静态活动吸引力越强。
区域内经过人数 ：反映动态使用率。穿越人次越多，说明该区域是活动路径或动态游戏区域。

通过对比分析儿童与家长在这三类热力图上的分布差异与关联，即可系统解构二者之间的空间交互模式。

三、实证：儿童游憩空间中的发现

研究选取了上海两个布局迥异的商业区儿童活动场地作为案例：

江湾广场 ：中心放射型布局，游戏设施集中在中部，开放性高。
西岸广场 ：线性带状布局，游戏设施位于中间带状区域，与周边区隔较明显。

在相同时段进行数据采集与分析后，研究揭示了两种空间布局下截然不同的"家长-儿童"交互模式：

1. 中心放射型空间（江湾广场）的交互模式：

行为分离 ：儿童活动高度集中于中心游乐设施区；家长则主要在场地四周边界移动看护 ，形成"外围环绕"模式。二者活动区域交集很少。
设计启示 ：
- 空间可分区独立设计：儿童活动区与家长看护区需求不同，可针对性优化。
- 关注设施朝向：儿童的主要奔跑方向（南北向）与家长的聚集方向（东西向）垂直，表明设施布局引导了儿童活动流线，进而决定了家长的观察位置。设计可通过调整设施朝向引导或分散家长聚集。

2. 线性带状空间（西岸广场）的交互模式：

行为交织 ：家长和儿童的活动区域高度重合 ，都集中在带状游戏区及两侧的休息区。家长多以静态驻留看护为主。
近距离跟随 ：儿童在游戏区与休息区之间往返，家长则在平行的休息带中移动，进行近距离跟随看护。
设计启示 ：
- 需考虑交叉使用：休息区需同时满足家长驻留和儿童间歇休息的需求。
- 设施布局的"节奏"控制：游戏设施在线性空间中的位置分布，决定了儿童活动的"热点"和家长的看护点，可用来调节空间使用密度，避免局部过度拥挤。

四、价值与局限

核心贡献：

技术方法创新：成功将"人群类型自动甄别"整合到公共空间尺度的计算机视觉行为分析流程中，实现了从"整体人群"分析到"多主体交互"分析的跃升。
设计研究桥梁：提出的三个行为指标（聚集、静态、动态）及其可视化热力图，能将复杂的行为数据转化为设计师可直观理解的空间形态语言（如"中心聚集"、"带状分布"、"环绕模式"），有力支撑了基于证据的设计决策和空间评估。
理论视角深化：强调了空间与行为的关系是一个"多层次的嵌套系统"，不仅包括环境对人的影响，还包括在空间媒介下不同人群之间的相互影响，推动了环境行为研究的精细化。

应用价值：

使用后评估（POE）：精准评估已建成空间中，不同人群的实际使用情况是否达到设计预期。
优化设计：为公共空间（尤其是儿童活动场地、代际共享空间等）的改造提升提供精准的数据支持和设计依据。

局限与未来方向：

人群甄别维度有限：目前仅能有效区分成人和儿童，无法识别更多人群类别（如不同年龄段老人、青少年等）。
行为语义较浅：基于轨迹，可分析"在哪聚集"、"停留多久"，但难以判断具体行为语义（如玩耍、交谈、休息）。

这项研究构建了一个从数据采集 （狩猎相机）、处理（YOLOX+ByteTrack追踪+IPM坐标转换）、分析（基于高宽比的多主体甄别+多维度指标计算）到可视化解读 （多主体热力图）的完整技术框架。它不仅仅是一项计算机视觉技术的应用，更是一次针对城市设计与环境行为研究领域核心需求的方法学创新。

计算机视觉：城市公共空间多主体行为计算

一、 背景与问题

二、 研究方法：技术框架

三、 实证：儿童游憩空间中的发现

四、 价值与局限

一、背景与问题

二、研究方法：技术框架

三、实证：儿童游憩空间中的发现

四、价值与局限