ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes 数据集构建

paper link: paperlink

Abstract: 这个数据集是个RGB-D视频数据集,在707个不同空间中获取了1513个扫描的场景,250w个视图,并且标注了相机位姿,表面重建,语义分割。本数据集共有20人扫描+500名工作者进行标注。

数据集获取框架

硬件设备: 使用Structure Sensor + ipad Air 2 进行收集,RGB 1296*968, Depth 640*480,默认启用白平衡+自动曝光。

相机校准:可以使用Srructure Sensor的Calibrate 软件进行校准。得到深度相机和彩色相机的关系。

用户界面:创建了ScannerApp进行数据集的采集,(但目前已经很久没更新了,sdk里有些类已经弃用了)

存储:128GB可以存储数小时的拍摄场景,用户可以随时点击"上传"按钮将扫描数据上传到处理服务器。

表面重建: BundleFusion 进行重建,1cm的 voxel resolution,VoxelHashing( 通过 VoxelHashing 实现体素融合 (Volumetric Integration)),marching cubes 在分辨率为4mm *4mm *4mm的voxel下进行高分辨率网格提取。对网格进行自动清理和简化(合并距离较近的顶点,删除重复的网格面和孤立的网格部分,对网格进行多分辨率的下采样,生成高中低分辨率的网格模型)

  • 使用 BundleFusion 计算每帧扫描数据的位姿。
  • 使用 VoxelHashing 构建 TSDF 表达的全局稠密体素网格。
  • 使用 Marching Cubes 提取高分辨率的三角网格。
  • 对网格进行清理、去噪和下采样,生成高、中、低分辨率的版本。

方向:自动将所有相机姿态对齐到一个共同的坐标系中,Z轴向上向量,xy平面和地面对齐。

验证:会自动丢弃较短、残差重建误差较大或对齐帧百分比较低的扫描序列。然后,也会手动检查并丢弃存在明显错位的重建。

准备复现一下,上述的效果,如果效果好,我再继续写

Semantic Annotation

总包。。待续

相关推荐
伶俜6611 分钟前
鸿蒙实战(二) ArkUI AI 相机:从零实现实时滤镜与人脸贴纸
人工智能·数码相机
暂未成功人士!2 小时前
雷达的标定 --- 雷达到相机(Lidar2Cam)标定 和 雷达到本体(Lidar2Baselink)标定的相关原理以及实现步骤
数码相机·雷达·坐标转换·标定·外参
互联网散修17 小时前
鸿蒙实战:从零实现自定义相机(下)——填平预览拉伸、比例错乱、缩略图消失的六大坑
数码相机·华为·harmonyos
初级炼丹师(爱说实话版)19 小时前
RealSense D435i 驱动安装梳理(Jetson Orin + JetPack 6.1)
数码相机
苏映视官方账号20 小时前
精品案例丨方寸之间,“微” 毫毕现 —— 圆刀机高精度检测工艺优化实例
人工智能·数码相机·视觉检测·制造
互联网散修1 天前
鸿蒙实战:从零实现自定义相机(上)——架构设计与核心实现
数码相机·华为·harmonyos·自定义相机
2601_957418801 天前
Android手机与相机USB有线连接技术
数码相机
jinxindeep2 天前
Dexterity-BEV:跨本体&跨相机&Action三维空间对齐,推动通用机器人策略学习
数码相机·学习·机器人
2601_957418802 天前
Android相机USB有线连接技术深度解析:PTP/MTP协议原理与工程实践
数码相机
yeflx2 天前
海康 NVR 相机图像采集
数码相机