光流

大江东去浪淘尽千古风流人物

【TAPIR】任意点跟踪：逐帧初始化+时序精炼的两阶段点追踪架构深度解析TAPIR（Tracking Any Point with per-frame Initialization and temporal Refinement）由Google DeepMind提出，是一个能够在视频中跟踪任意物理表面点的模型。其核心设计是两阶段管线：第一阶段通过全局匹配逐帧独立初始化候选轨迹，第二阶段通过局部相关性的时序深度卷积网络迭代精炼。在TAP-Vid benchmark上，TAPIR在DAVIS数据集上实现~20% AJ绝对提升（61.3 vs PIPs 42.0），同时比PIPs快

【光流】2015：FlowNet: Learning Optical Flow with Convolutional Networks卷积神经网络（CNNs）近期在各类计算机视觉任务中取得了显著成功，尤其在识别相关的任务中表现尤为突出。然而，光流估计并未成为卷积神经网络取得成功的应用领域之一。在本文中，我们设计了合适的卷积神经网络，将光流估计问题构建为 supervised learning（监督学习）任务。我们提出并比较了两种网络架构：一种为通用架构，另一种则包含一个在不同图像位置之间对特征向量进行相关计算的层。

大江东去浪淘尽千古风流人物

【Flow4DGS-SLAM】动态环境3DGS-SLAM：光流引导自运动分解与混合4D Gaussian深度解析（CVPR 2026）Flow4DGS-SLAM（CVPR 2026，NUS）针对动态场景 3DGS-SLAM 的两大痛点——变形场训练慢和语义分割依赖——提出了全新的光流引导框架。核心思路是用 depth + 先验光流拟合相机自运动模型，不依赖任何语义类别，直接从残差中生成动态掩膜，同时提供更稳定的位姿初始化。动态区域用混合 4D Gaussian 表示（显式时序位置 + GMM 透明度/旋转 + KNN 刚性约束），相比基线 4DGS-SLAM 将建图速度提升 17.6 倍，PSNR 提升 4 dB，TUM RGB-D A

FlowFormer: A Transformer Architecture for Optical Flow——一种用于光流估计的Transformer架构这篇论文提出了一种新的基于 Transformer 的光流估计网络架构，称为 FlowFormer。其核心目标是结合 Transformer 在长距离建模方面的优势与传统光流估计中代价体（cost volume）表示的有效性，从而实现更准确、更具泛化能力的光流估计。

OpenCV 官翻8 - 其他算法https://docs.opencv.org/4.x/d3/db7/tutorial_hdr_imaging.html

机器学习笔记 - 用于3D物体检测的KITTI数据集的使用及说明KITTI 是由卡尔斯鲁厄理工学院和芝加哥丰田理工学院开发的自动驾驶数据集（目前分2012和2015版本）。它是计算机视觉研究中使用的图像和 LIDAR 数据的集合，例如立体视觉、光流、视觉里程计、3D 对象检测和 3D 跟踪。

提取视频光流成帧并写入视频中修改一下配置文件就可以运行了参考：提取光流

我是有底线的