视觉几何(3D->2D,2D->3D)

成像基本原理

相机标定指建立相机图像像素位置与场景点位置之间的关系,即求解相机模型的参数。

(u,v)为图像点

K为相机内参数(相机硬件)

R为相机旋转,t为相机平移(相机位姿)

(X,Y,Z)为空间点

f为焦距,dx,dy为每个像素的距离,u0,v0为主点坐标

世界坐标系->相机坐标系(刚体变换)

相机坐标系->图像坐标系(透视投影)

图像坐标系->像素坐标系(仿射变换)

  • 三角化:已知图像点,内参和外参,求空间点
  • 姿态估计:已知图像点,内参和空间点,求外参
  • 相机标定:已知图像点和空间点,求内参和外参
  • 稀疏重建:已知图像点,求其他

相机畸变

  • 像素坐标轴倾斜
  • 透镜形状缺陷

径向畸变:枕形畸变和桶形畸变(k1,k2,k3矫正系数)

切向畸变(p1,p2矫正系数)

  • 组装工艺偏差

手眼关系

手在眼上:顾名思义,也就是相机与机械臂是一体,那么此时相机与机械臂末端的位置是相对不变的,手眼矩阵就是相机与机械臂之间的转换

手在眼外:相机与机械臂是固定在不同地方的,那么此时相机与机械臂底座的位置是相对不变的,手眼矩阵是相机与机械臂底座的转换

相机看到一个物体的 3D 坐标 → 用手眼矩阵转一下 → 变成机械臂能直接用的坐标 → 去抓。

手眼就是相机和机械手之间的固定变换,用来把相机看到的东西转给机械臂用。

2D->3D

核心逻辑链(能口述)

  1. 相机拍出来的是2D 像素点
  2. 像素点 → 反推回相机坐标系下的 3D 射线
  3. 再结合深度 / 外参 / 手眼 → 得到世界坐标系 3D 点
  • 图上取一点:(u,v)
  • 得到深度:Zc(来自双目 / 深度相机 / 激光)
  • 像素 → 相机 3D
  • 相机 → 世界 3D

双目相机计算深度原理,也就是视差图转为深度图:

f为焦距,b为基线长度,d为视差

流程:

  • 获取左右图像
  • 提取特征点(SIFT/ORB...)
  • 粗匹配(得到一堆初始匹配对KNN/BF)
  • 计算基础矩阵 F / 本质矩阵 E → 得到极线约束
  • 根据极线约束,剔除错误匹配
  • 双目矫正(rectification) → 让极线变成水平共线
  • 在水平极线上做密集匹配 → 这就是你说的:必须在极线上匹配!
  • 得到视差图 → 深度图
相关推荐
Fabarta技术团队8 分钟前
务实、灵活——枫清科技财务单证智能审核方案 以AI自学习驱动审核提效与规则进化
人工智能·科技·学习
cczixun8 分钟前
AI落地深水区:从技术狂欢到产业重构的价值革命
人工智能·科技
奇思智算10 分钟前
2026年AI算力租用平台深度横评:阿里云_腾讯云_AutoDL_智星云谁更适合你?
人工智能·阿里云·云计算·腾讯云·gpu算力租用
森诺Alyson12 分钟前
前沿技术借鉴研讨-2026.4.16(视觉语言模型/医学影像文本多模态对齐)
论文阅读·人工智能·经验分享·计算机视觉·语言模型
DianSan_ERP16 分钟前
淘宝订单接口集成中如何正确处理消费者敏感信息的安全与合规问题?
大数据·运维·网络·人工智能·安全·servlet
zhengyquan24 分钟前
特斯拉无方向盘Cybercab落地,自动驾驶商业化再提速!
人工智能·机器学习·自动驾驶
愚公搬代码28 分钟前
【愚公系列】《OpenClaw实战指南》017-写作与整理:让OpenClaw 接管你的周报与公文(OpenClaw Skill调用详解)
人工智能·机器人·自动化·飞书·openclaw
ZPC821032 分钟前
ROS2 通信提速快过UDP
人工智能·算法·机器人
YOULANSHENGMENG33 分钟前
深度学习的一些基础知识
人工智能·深度学习
Henry-SAP33 分钟前
SAP MRP销售订单与预测驱动的业务解析
人工智能·sap·erp