步骤 | 输入 | 输出 |
---|---|---|
运动恢复结构(SfM) | 多视角图像 摄像机内参 | 稀疏三维点云 摄像机外参(位姿) |
多视立体视觉(MVS) | 多视角图像 摄像机内、外参 稀疏三维点云 | 稠密三维点云 |
表面重建 | 稠密三维点云 | 场景/模型的三角网格 |
纹理重建 | 多视角图像 摄像机内、外参 | 场景/模型的纹理图像 |
表面重建的结果可以用于物理仿真,纹理重建的结果可用于可视化。
基于NeRF的方法可以用于可视化,但由于没有表面重建的过程,所以无法用于物理仿真
案例:BlockNeRF-城市级渲染、\(\text{F}^2\)NeRF-自由视点渲染
摄像机的内参数由EXIF信息生成(可直接使用Colmap、Metashape等软件获得),外参数由运动恢复结构(SfM)获得。
后续内容中没有特殊说明,所有坐标均采用齐次坐标表示,因此,不再使用h下标标识。
内参数决定了相机坐标系下空间点到图像点的映射!
从单张图像恢复场景几何很困难,因为单幅视图2D到3D的映射具有多义性。
极几何描述了同一场景或者物体的两个视点图像间的几何关系。
本质矩阵对规范化摄像机拍摄的两个视点图像间的极几何关系进行代数描述。
基础矩阵对一般的透视摄像机拍摄的两个视点的图像间的极几何关系进行代数描述。
Structure from Motion (SfM) 通过三维场景的多张图象,恢复出该场景的三维结构信息以及每张图片对应的摄像机参数。
三种典型的运动恢复结构任务
欧式结构恢复(2视图)
求解:\(n\)个三维点\(𝑋_𝑗 (j = 1, \cdots , n )\)的坐标;
\(m\)个摄像机的外参数\(\mathbf{R}_i\)及\(\mathbf{T}_i (i = 1, \cdots , m)\)
代数方法(𝑵视图情况)
捆绑调整(Bundle Adjustment) 恢复结构和运动的非线性方法