UI演示双视图立体匹配与重建

发布时间：2023年12月29日

相关文章：

PyQt5和Qt designer的详细安装教程：https://blog.csdn.net/qq_43811536/article/details/135185233?spm=1001.2014.3001.5501
Qt designer界面和所有组件功能的详细介绍：https://blog.csdn.net/qq_43811536/article/details/135186862?spm=1001.2014.3001.5501
Qt designer设计UI实例：双视图立体匹配与重建的可视化UI：https://blog.csdn.net/qq_43811536/article/details/135198820?spm=1001.2014.3001.5501
基于PyQt5自定义UI的详细教程：https://blog.csdn.net/qq_43811536/article/details/135284469?spm=1001.2014.3001.5501

1. 实例：双视图立体匹配与重建的可视化UI

输入：一对左右眼视图的图像。
任务：对输入的一对带相机参数的左右眼图像数据，实现SAD、NCC 两种局部的立体匹配方法进行重建。
输出：
- 基本的交互界面供用户选择立体匹配算法以及输入的图片。
- 将每种立体匹配方法所用的时间以及图片大小信息显示出来。
- 可视化重建的结果，如点云，深度图，视差图等，可以使用Meshlab 软件
  或者Open3D 进行可视化

2. 实现描述

2.1 算法简介

本项目旨在通过双视图立体匹配技术实现三维场景重建。输入为一对左右眼视图的图像，输出为三维重建的深度图可视化结果。本报告通过实现 WTA（Winner-Take-All）和 SGM（Semi-Global Matching）匹配算法，结合 SAD（Sum of Absolute Differences）、SSD（Sum of Squared Differences）和 NCC（Normalized Cross-Correlation）三种成本函数，提供了一个用于立体图像匹配和深度图重建的较为完整的解决方案。

匹配算法：
- WTA：一种简单但有效的匹配策略，选择具有最低成本的匹配作为最终结果。
- SGM：一种更复杂的方法，通过考虑图像中的邻近像素来优化匹配过程。
成本计算：
- SAD：计算两个窗口中对应像素差的绝对值之和。
- SSD：计算两个窗口中对应像素差的平方和。
- NCC：衡量两个窗口的相似性。

2.2 用户界面

基于上一小节具体的算法实现，本报告使用Qt Designer 设计了一个可供用户交互的界面，详情参考Qt designer设计UI实例：双视图立体匹配与重建的可视化UI。界面包含图片选择（Picture）、匹配算法选择（Matching algorithm）、成本函数选择（Matching cost）、运行按钮（Run）、图片显示窗口（Picture visualization）、结果显示窗口（Results display）和输出信息窗口（Output information）。然后使用 PyQt5 实现界面的初始化和槽函数自定义，详情参考基于PyQt5自定义UI的详细教程。

2.3 功能流程

用户选择双视图：本报告提供了5对双视图，分别为“Adirondack”、“cones”、“bow-ling”、“artroom1”和“chess1” ¹，其中前两对双视图提供深度图的ground truth（灰度图）以及masked image（用于排除遮挡区域的掩码图），最后两对提供左右视图的彩色深度图的ground truth但缺少masked image，中间的“bowling”仅有左右视图。在用户选择好图片之后，被选择的图片会实时绘制在Picture visualization窗口中，根据可视化结果用户可以决定是否更改图片选择。
选择匹配参数：我们的界面相对简陋，目前只提供两种匹配算法WTA和SGM，以及三种成本SAD、SSD和NCC。有关算法的细节比如max_disparity（要考虑的最大差距）、filter_radius（滤波器半径）以及accx_threshold（计算重建精度Acc时的阈值差）等参数未提供接口，默认使用实验过程确定好的参数。
运行：用户点击“RUN”按钮开始匹配和重建过程。这部分可能需要等候一段时间。
结果显示：在Results display窗口输出深度图，同时Output information窗口显示运行日志、用时、图片大小和重建精度（如果存在ground truth）等信息。所有结果都保存在“./results”中。

3. 实验结果

3.1 运行结果展示

以图片“Adirondack”为例，下图展示了该图片在使用SGM和NCC算法时的重建结果以及运行过程中的用户界面。其中运行时长为21.565s，重建精度为0.929。

在这里插入图片描述

3.2 算法性能对比

我们以双视图“Adirondack”和“cones”为例，分别对两种匹配算法和三种成本算法进行重建性能和用时对比。“bowling”的重建结果见附录图。

下面两幅图分别呈现两个双视图在不同匹配和成本算法下的深度图结果，两个表格分别罗列重建性能和用时的量化结果。

在两个不同的场景下，全局匹配算法SGM的性能都是要显著优于WTA的，但由于算法的复杂性相应的用时也会成倍增长。这主要是因为SGM通过考虑像素间的连续性和平滑性，减少了匹配错误，同时它的算法结构使其对图像噪声和纹理不均匀区域更具鲁棒性，在处理复杂场景（如遮挡、重复纹理等）时表现更优。但SGM 的计算复杂度高于 WTA，因此在计算资源受限的环境中可能不太适用。
成本算法NCC相比其他两种成本性能提升显著。这主要是以为NCC对光照变化和图像强度缩放具有较好的鲁棒性。它通过归一化操作减少了这些因素的影响。在光照变化显著的环境下，NCC 往往能提供比 SAD 和 SSD 更准确的匹配结果，比如“Adirondack_SGM_NCC”性能最优。但NCC 的计算相对复杂，可能不适合对实时性要求较高的应用。而SSD 对差异较大的像素施加更强的惩罚，有助于准确匹配高对比度的特征，比如“cones_SGM_SSD”性能最优。

图1

请添加图片描述

图2

在这里插入图片描述

4. 源代码

源代码可以从GitHub链接获取：https://github.com/Jurio0304/Two-view_Stereo_Matching_and_Reconstruction

~~创作不易，参考的话球球给个star…~~

5. 附录