讲座 | 颠覆传统摄像方式乃至计算机视觉的“脉冲视觉”

传统相机拍摄视频时其实是以一定帧率进行采样,视频其实还是一串图片的集合,因此低帧率时会觉得视频卡,拍摄高速运动物体时会有运动模糊等等问题。然而你能想象这一切都可以被"脉冲视觉"这一前沿技术改变吗?

今天下午听了北京大学黄铁军教授的演讲,颇感震撼。黄教授团队的"脉冲视觉"研究从基础理论方面突破,变革了已经沿用两个世纪的传统感光方式,使得每个新型感光元器件可以每个像素单独对光子进行捕获,并可以重现拍摄时任意时刻的清晰图像。也就是说,有了脉冲相机,也许以后都不会再谈帧率了,因为拍摄到的信息将无限接近现实的光的运动,其时域采样率为4万赫兹,这是以前所有动辄上百万的高帧率相机都无法比拟的。此外,脉冲相机的感光元件可以利用现有的CMOS制造技术上进行制造,使得成本可以控制得比较低。这项技术可以说意义非凡,前景广泛。

接着,黄教授还介绍了脉冲相机在高铁检修、涡轮停机检修等方面的应用。我比较感兴趣的是基于脉冲的视觉任务。传统计算机视觉基于的图像、视频等基本是用传统相机拍摄的(当然也不排除用特殊成像方式的),在计算机中图像通常以像素矩阵存储,而脉冲相机拍摄的脉冲序列我认为其实可以看做光子的到达时间序列,提供了更接近物理现实的记录。在脉冲序列上黄教授团队也做了一系列研究,将光流与深度估计、检测跟踪、目标识别等视觉任务基于脉冲序列进行了实现,得到了成倍的速度提升与SOTA的效果。我觉得在脉冲相机的基础上未来可以实现更类脑的神经网络并实现更接近人类视觉能力的方法。

基于脉冲的视觉任务方面,黄教授团队设计并开源了SpikeCV,即在OpenCV的基础上,针对脉冲序列进行了设计,还额外提供了脉冲相机的接口和已经拍摄好的数据集。地址:https://openi.pcl.ac.cn/Cordium/SpikeCV

有同学问了两个比较关心的问题,即脉冲相机的功耗会不会由于高速采样而很高?以及,脉冲相机拍摄的视频占用存储空间会不会很大?黄教授的回答基本上是,首先功耗确实会比正常大,但可以接受。其次存储由于对脉冲进行了编码,其占用带宽在Gbps,存储空间需求虽然大但也可以在现有硬件上可以得到满足。

总之,黄教授的这次演讲干货满满,相信不久的将来可以从前沿研究真正上到我们手机上。研究项目地址:https://spikecv.github.io/

相关推荐
科技新知11 小时前
大厂AI各走“开源”路
人工智能·开源
字节数据平台11 小时前
火山引擎Data Agent再拓新场景,重磅推出用户研究Agent
大数据·人工智能·火山引擎
TGITCIC11 小时前
LLaVA-OV:开源多模态的“可复现”革命,不只是又一个模型
人工智能·开源·多模态·ai大模型·开源大模型·视觉模型·大模型ai
GeeLark11 小时前
GeeLark 9月功能更新回顾
人工智能
mwq3012311 小时前
GPT-2 中的 Pre-Layer Normalization (Pre-LN) 架构详解
人工智能
智奇数美11 小时前
“成本减法”与“效率乘法”——AI智能重构企业通信格局
人工智能·智能手机·信息与通信
技术闲聊DD11 小时前
机器学习(1)- 机器学习简介
人工智能·机器学习
mwq3012311 小时前
GPT-2 中的残差权重初始化
人工智能
mwq3012312 小时前
Transformer : 深度神经网络中的残差连接 (Residual Connection)
人工智能
信田君952712 小时前
瑞莎星瑞(Radxa Orion O6) 基于 Android OS 使用 NPU的图片模糊查找APP 开发
android·人工智能·深度学习·神经网络