深度学习:光流估计新范式

0.概述

在这篇文章中,我们将讨论两种基于深度学习的光流运动估计方法。FlowNet是第一个用于计算光流的CNN方法,RAFT是当前最先进的估计光流的方法。我们还将看到如何使用作者提供的经过训练的模型来使用PyTorch对新数据进行推断。

1. FlowNet

FlowNet architecture 于2015年推出,是第一个预测光流的CNN方法。作者受到CNN架构在分类、深度估计和语义分割任务中的成功结果的启发。随着深度学习方法和CNN成为解决许多计算机视觉任务的有利策略,作者又引入了两个用于光流估计的神经网络。

1.1 Architecture

FlowNetS和FlowNetCorr架构都包含类似于U-Net架构的编码器和解码器部分。编码器从两个连续的图像中提取特征,而解码器升级编码器特征图并获得最终的光流预测。让我们更深入地了解一下FlowNetS和FlowNetCorr网络。

1.2 FlowNetS encoder

流网络(也称为FlowNetSimple)中的输入数据是两个连续帧的串联。这两幅图像被放置到6通道张量中,其中前三个通道属于第一幅图像,其余三个通道属于第二幅图像。编码器部分由几个卷积层组成,后面是激活函数。这种架构允许网络自己决定如何处理两个堆叠的图像,并为以下结果细化提供特征图。

2.

相关推荐
Aileen_0v0几秒前
【Gemini3.0的国内use教程】
android·人工智能·算法·开源·mariadb
xiaogutou11212 分钟前
5款软件,让歌唱比赛海报设计更简单
人工智能
后端小张19 分钟前
智眼法盾:基于Rokid AR眼镜的合同条款智能审查系统开发全解析
人工智能·目标检测·计算机视觉·ai·语言模型·ar·硬件架构
dalalajjl21 分钟前
每个Python开发者都应该试试知道创宇AiPy!工作效率提升500%的秘密武器
大数据·人工智能
wheeldown22 分钟前
【Rokid+CXR-M】基于Rokid CXR-M SDK的博物馆AR导览系统开发全解析
c++·人工智能·ar
爱看科技24 分钟前
AI智能计算竞赛“战火重燃”,谷歌/高通/微美全息构建AI全栈算力开启巅峰角逐新篇
人工智能
IT_陈寒32 分钟前
Redis性能翻倍的5个冷门技巧,90%开发者都不知道第3个!
前端·人工智能·后端
浩浩的代码花园43 分钟前
自研端侧推理模型实测效果展示
android·深度学习·计算机视觉·端智能
晨非辰1 小时前
C++ 波澜壮阔 40 年:从基础I/O到函数重载与引用的完整构建
运维·c++·人工智能·后端·python·深度学习·c++40周年
鼎道开发者联盟1 小时前
智能原生操作系统畅想:人智共生新时代的基石
人工智能·机器学习·自然语言处理