深度学习:光流估计新范式

0.概述

在这篇文章中,我们将讨论两种基于深度学习的光流运动估计方法。FlowNet是第一个用于计算光流的CNN方法,RAFT是当前最先进的估计光流的方法。我们还将看到如何使用作者提供的经过训练的模型来使用PyTorch对新数据进行推断。

1. FlowNet

FlowNet architecture 于2015年推出,是第一个预测光流的CNN方法。作者受到CNN架构在分类、深度估计和语义分割任务中的成功结果的启发。随着深度学习方法和CNN成为解决许多计算机视觉任务的有利策略,作者又引入了两个用于光流估计的神经网络。

1.1 Architecture

FlowNetS和FlowNetCorr架构都包含类似于U-Net架构的编码器和解码器部分。编码器从两个连续的图像中提取特征,而解码器升级编码器特征图并获得最终的光流预测。让我们更深入地了解一下FlowNetS和FlowNetCorr网络。

1.2 FlowNetS encoder

流网络(也称为FlowNetSimple)中的输入数据是两个连续帧的串联。这两幅图像被放置到6通道张量中,其中前三个通道属于第一幅图像,其余三个通道属于第二幅图像。编码器部分由几个卷积层组成,后面是激活函数。这种架构允许网络自己决定如何处理两个堆叠的图像,并为以下结果细化提供特征图。

2.

相关推荐
Dongsheng_201936 分钟前
【汽车篇】AI深度学习在汽车零部件外观检测——刹车片中的应用
人工智能·汽车
LONGZETECH37 分钟前
【龙泽科技】汽车转向悬架与制动安全系统技术1+X仿真教学软件(1.2.3 -初级)
人工智能·科技·汽车·汽车仿真教学软件·汽车教学软件
JAVA学习通1 小时前
PostgreSQL 的 hstore、arrays 数据类型
人工智能·自然语言处理
材料科学研究1 小时前
掌握PINN:从理论到实战的神经网络进阶!!
深度学习·神经网络·pinn
B站计算机毕业设计之家1 小时前
多模态项目:Python人脸表情系统 CNN算法 神经网络+Adaboost定位+PyQt5界面 源码+文档 深度学习实战✅
python·深度学习·神经网络·opencv·yolo·计算机视觉·情绪识别
AKAMAI2 小时前
云成本困境:开支激增正阻碍欧洲AI创新
人工智能·云原生·云计算
大模型真好玩2 小时前
LangGraph实战项目:从零手搓DeepResearch(一)——DeepResearch应用体系详细介绍
人工智能·python·mcp
IT古董2 小时前
【第五章:计算机视觉-项目实战之生成式算法实战:扩散模型】3.生成式算法实战:扩散模型-(4)在新数据集上微调现有扩散模型
人工智能
嵌入式-老费2 小时前
Easyx图形库使用(潜力无限的图像处理)
图像处理·人工智能
JXY_AI2 小时前
AI问答与搜索引擎:信息获取的现状
人工智能·搜索引擎