讲座 | 颠覆传统摄像方式乃至计算机视觉的“脉冲视觉”

传统相机拍摄视频时其实是以一定帧率进行采样,视频其实还是一串图片的集合,因此低帧率时会觉得视频卡,拍摄高速运动物体时会有运动模糊等等问题。然而你能想象这一切都可以被"脉冲视觉"这一前沿技术改变吗?

今天下午听了北京大学黄铁军教授的演讲,颇感震撼。黄教授团队的"脉冲视觉"研究从基础理论方面突破,变革了已经沿用两个世纪的传统感光方式,使得每个新型感光元器件可以每个像素单独对光子进行捕获,并可以重现拍摄时任意时刻的清晰图像。也就是说,有了脉冲相机,也许以后都不会再谈帧率了,因为拍摄到的信息将无限接近现实的光的运动,其时域采样率为4万赫兹,这是以前所有动辄上百万的高帧率相机都无法比拟的。此外,脉冲相机的感光元件可以利用现有的CMOS制造技术上进行制造,使得成本可以控制得比较低。这项技术可以说意义非凡,前景广泛。

接着,黄教授还介绍了脉冲相机在高铁检修、涡轮停机检修等方面的应用。我比较感兴趣的是基于脉冲的视觉任务。传统计算机视觉基于的图像、视频等基本是用传统相机拍摄的(当然也不排除用特殊成像方式的),在计算机中图像通常以像素矩阵存储,而脉冲相机拍摄的脉冲序列我认为其实可以看做光子的到达时间序列,提供了更接近物理现实的记录。在脉冲序列上黄教授团队也做了一系列研究,将光流与深度估计、检测跟踪、目标识别等视觉任务基于脉冲序列进行了实现,得到了成倍的速度提升与SOTA的效果。我觉得在脉冲相机的基础上未来可以实现更类脑的神经网络并实现更接近人类视觉能力的方法。

基于脉冲的视觉任务方面,黄教授团队设计并开源了SpikeCV,即在OpenCV的基础上,针对脉冲序列进行了设计,还额外提供了脉冲相机的接口和已经拍摄好的数据集。地址:https://openi.pcl.ac.cn/Cordium/SpikeCV

有同学问了两个比较关心的问题,即脉冲相机的功耗会不会由于高速采样而很高?以及,脉冲相机拍摄的视频占用存储空间会不会很大?黄教授的回答基本上是,首先功耗确实会比正常大,但可以接受。其次存储由于对脉冲进行了编码,其占用带宽在Gbps,存储空间需求虽然大但也可以在现有硬件上可以得到满足。

总之,黄教授的这次演讲干货满满,相信不久的将来可以从前沿研究真正上到我们手机上。研究项目地址:https://spikecv.github.io/

相关推荐
Learn Beyond Limits几秒前
固定窗口神经语言模型|A fixed-window neural Language Model
人工智能·语言模型·自然语言处理
时光瀚海几秒前
跨境旅游出海指南:如何通过国际短信(SMS)精准营销美国华裔银发族?
人工智能·经验分享·旅游·跨境电商·短信营销
来两个炸鸡腿2 分钟前
【Datawhale2603】happy-llm task04 Encoder-Decoder预训练
人工智能·学习·大模型
石工记3 分钟前
OpenClaw AI 助手 Docker Compose 一键部署文档(MacBook Pro 2020 专属版,可下载)
人工智能·docker·容器
Lab_AI6 分钟前
京博控股集团科研管理的智慧创新之道
人工智能·项目管理·电子实验记录本·仪器管理·科研管理·研发数字化
QBoson7 分钟前
量子启发 AI 破解 PDE 难题:QIDNNF 让流体、波动力学模拟更稳更准
人工智能·量子计算·深度神经网络
AaronZZH7 分钟前
规范驱动开发(SDD):AI时代的软件工程新范式
人工智能·驱动开发·软件工程
你好helloworld9 分钟前
claude code安装部署
人工智能
Oscar的参数9 分钟前
在 Windows 上部署 龙虾OpenClaw:基于 WSL2 的详细教程
人工智能·windows·深度学习·ai·语言模型
OpenCSG12 分钟前
LTX-2.3:开源AI视频生成的新标杆,一个模型同时生成视频和音频
人工智能·开源·音视频