对 pcl::StatisticalOutlierRemoval 滤波器的理解

发布时间:2024年01月04日

对 pcl::StatisticalOutlierRemoval 滤波器的理解

注:以下内容基于与 GPT-4 的交流并结合个人理解整理而成。若有描述不准确或模糊之处,欢迎指正。

参数配置

  1. setMeanK(int meanK):
    • 此参数设置每个点要考虑的邻居数量,影响着计算点的局部平均距离。较大的 meanK 值可能包含更多的邻居,使滤波过程更加平滑,但可能降低移除离群点的能力。选择合适的 meanK 值取决于点云数据的密度和规模。例如,在稠密的点云中,较小的 meanK 值可能就足够了,而在稀疏的点云中,可能需要更大的 meanK 值来获得可靠的平均距离估计。
  2. setStddevMulThresh(double stddevMulThresh):
    • 此参数定义了离群点的阈值,基于平均距离的标准差的倍数计算。较高的 stddevMulThresh 值意味着更宽松的离群点判断标准,可能保留更多的噪声点;较低的值则更严格,可能移除更多有效数据点。通常,开始时使用默认值(如 1.0),然后根据实际数据的噪声水平进行调整。
  3. setNegative(bool negative):
    • 此布尔参数决定滤波器保留或排除检测到的离群点。若设置为 true,滤波器将保留被标记为离群点的数据,移除其他点;若为 false,则只保留非离群点。
  4. setInputCloud(const PointCloudConstPtr &cloud):
    • 用于设置输入点云,是进行滤波处理前的必要步骤。
  5. filter(PointCloud &output):
    • 虽然不是一个配置参数,但这个方法用于执行滤波操作。它应用上述设置的参数并产生滤波后的点云。

使用示例

#include <pcl/filters/statistical_outlier_removal.h>

// 移除统计离群值
pcl::StatisticalOutlierRemoval<pcl::PointXYZ> sor;
sor.setInputCloud(parent_filtered_cloud);
sor.setMeanK(50);
sor.setStddevMulThresh(1.0);
sor.filter(*parent_filtered_cloud);

执行逻辑

注: 这里离群点的去除, 去除的是主点, 如果一个主点距离其最近的几个点的平均距离整个点云的平均距离相差较大, 则把这个主点抠掉

  1. 根据setMeanK的值为每一个点划分(这个是我给这个过程起的名称)

    例如有A1, A2, A3…An个点, MeanK=5, 那么假设距离每个点最近的点是序号邻近的点, 即距离A1最近的5个点是An-1, An, A2, A3, A4, 则这就是A1的群[An-1, An, A2, A3, A4], 同理A2的群为[An, A1, A3, A4, A5], 以此类推

  2. 计算每个群距离其主点(群的名称, 如A1, A2等)的平均距离

    例如, A1, 群为[An-1, An, A2, A3, A4], 计算 每一个点距离A1的距离, 求均值, 得到 d1

    A2, 群为[An, A1, A3, A4, A5], 计算 每一个点距离A2的距离, 求均值, 得到 d2, 以此类推

  3. 计算整个点云的平均距离及其标准差

    d1到dn的平均值, 即为整个点云的平均距离, 记为 D

    计算d1到dn的标准差σ
    平方和 : ∑ i = 1 n ( d i ? D ) 2 方差 : 1 n ∑ i = 1 n ( d i ? D ) 2 标准差 : σ = 1 n ∑ i = 1 n ( d i ? D ) 2 平方和: \sum_{i=1}^n (d_i - D)^2 \\ 方差: \frac{1}{n} \sum_{i=1}^n (d_i - D)^2 \\ 标准差: σ=\sqrt {\frac{1}{n} \sum_{i=1}^n (d_i - D)^2} 平方和:i=1n?(di??D)2方差:n1?i=1n?(di??D)2标准差:σ=n1?i=1n?(di??D)2 ?

  4. 根据setStddevMulThresh的值界定离群点, 假设, 该值为 μ

    对于某个点 Am 有
    d m > D + μ × σ d_m > D + μ ×σ dm?>D+μ×σ
    则Am为离群点, 将其去除

可以看到, 这里判断的是主点与整个点云之间是否存在异常现象, 即不合群, 整个点云平均距离是D, 平均也就差了一个标准差, 这个点Am跟邻近点的距离比这个大, 因此, 抠掉!

一点点细节

既然方差跟标准差描述的都是数据的离散程度, 为什么在这里选用的是标准差而不是方差?

  1. 单位统一

    方差由于对原始数据进行了平方, 因此他的单位是原单位的平方, 比如在点云处理上, 单位是[m] 或者[cm], 而平方和处理之后, 单位就变成了 [m2] 或者[cm2], 这时对数据开根号, 可以保证单位一致

  2. 可以直接相加减

    因为单位统一, 那么就可以直接在原始数据的基础上加减这个标准差, 来定义一个新的范围, 也正是因此划定了离群这一概念

文章来源:https://blog.csdn.net/SmileJayNew/article/details/135379034
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。