注:以下内容基于与 GPT-4 的交流并结合个人理解整理而成。若有描述不准确或模糊之处,欢迎指正。
setMeanK
(int meanK):
meanK
值可能包含更多的邻居,使滤波过程更加平滑,但可能降低移除离群点的能力。选择合适的 meanK
值取决于点云数据的密度和规模。例如,在稠密的点云中,较小的 meanK
值可能就足够了,而在稀疏的点云中,可能需要更大的 meanK
值来获得可靠的平均距离估计。setStddevMulThresh
(double stddevMulThresh):
stddevMulThresh
值意味着更宽松的离群点判断标准,可能保留更多的噪声点;较低的值则更严格,可能移除更多有效数据点。通常,开始时使用默认值(如 1.0),然后根据实际数据的噪声水平进行调整。setNegative
(bool negative):
true
,滤波器将保留被标记为离群点的数据,移除其他点;若为 false
,则只保留非离群点。setInputCloud
(const PointCloudConstPtr &cloud):
filter
(PointCloud &output):
#include <pcl/filters/statistical_outlier_removal.h>
// 移除统计离群值
pcl::StatisticalOutlierRemoval<pcl::PointXYZ> sor;
sor.setInputCloud(parent_filtered_cloud);
sor.setMeanK(50);
sor.setStddevMulThresh(1.0);
sor.filter(*parent_filtered_cloud);
注: 这里离群点的去除, 去除的是主点, 如果一个主点距离其最近的几个点的平均距离与整个点云的平均距离相差较大, 则把这个主点抠掉
根据setMeanK
的值为每一个点划分群(这个是我给这个过程起的名称)
例如有A1, A2, A3…An个点, MeanK=5, 那么假设距离每个点最近的点是序号邻近的点, 即距离A1最近的5个点是An-1, An, A2, A3, A4, 则这就是A1的群[An-1, An, A2, A3, A4], 同理A2的群为[An, A1, A3, A4, A5], 以此类推
计算每个群距离其主点(群的名称, 如A1, A2等)的平均距离
例如, A1, 群为[An-1, An, A2, A3, A4], 计算 每一个点距离A1的距离, 求均值, 得到 d1
A2, 群为[An, A1, A3, A4, A5], 计算 每一个点距离A2的距离, 求均值, 得到 d2, 以此类推
计算整个点云的平均距离及其标准差
d1到dn的平均值, 即为整个点云的平均距离, 记为 D
计算d1到dn的标准差σ
平方和
:
∑
i
=
1
n
(
d
i
?
D
)
2
方差
:
1
n
∑
i
=
1
n
(
d
i
?
D
)
2
标准差
:
σ
=
1
n
∑
i
=
1
n
(
d
i
?
D
)
2
平方和: \sum_{i=1}^n (d_i - D)^2 \\ 方差: \frac{1}{n} \sum_{i=1}^n (d_i - D)^2 \\ 标准差: σ=\sqrt {\frac{1}{n} \sum_{i=1}^n (d_i - D)^2}
平方和:i=1∑n?(di??D)2方差:n1?i=1∑n?(di??D)2标准差:σ=n1?i=1∑n?(di??D)2?
根据setStddevMulThresh
的值界定离群点, 假设, 该值为 μ
对于某个点 Am 有
d
m
>
D
+
μ
×
σ
d_m > D + μ ×σ
dm?>D+μ×σ
则Am为离群点, 将其去除
可以看到, 这里判断的是主点与整个点云之间是否存在异常现象, 即不合群, 整个点云平均距离是D, 平均也就差了一个标准差, 这个点Am跟邻近点的距离比这个大, 因此, 抠掉!
单位统一
方差由于对原始数据进行了平方, 因此他的单位是原单位的平方, 比如在点云处理上, 单位是[m] 或者[cm], 而平方和处理之后, 单位就变成了 [m2] 或者[cm2], 这时对数据开根号, 可以保证单位一致
可以直接相加减
因为单位统一, 那么就可以直接在原始数据的基础上加减这个标准差, 来定义一个新的范围, 也正是因此划定了离群这一概念