机器学习之降维（维度灾难和维度爆炸）

发布时间：2023年12月26日

在机器学习中，降维是指通过减少数据的特征维度来简化数据表示的过程。高维数据集可能包含冗余的信息，降维的目标是保留尽可能多的有用信息，同时减少数据的维度。降维的主要优势包括提高模型的计算效率、减轻维度灾难（curse of dimensionality）的影响以及更好地可视化数据。

维度灾难和维度爆炸

1. 维度灾难 (Curse of Dimensionality):

维度灾难指的是在高维空间中，许多常用的距离度量和机器学习算法的性能会受到影响，而不再适用于低维空间时的效果。主要表现在以下几个方面：

样本稀疏性: 随着维度的增加，训练数据在高维空间中变得非常稀疏，使得样本之间的距离变得相对较大。
距离计算问题: 在高维空间中，欧氏距离的计算结果会受到维度增加的影响，所有数据点之间的距离趋向于相等，降低了距离的区分度。
需要更多数据: 随着维度的增加，为了维持相同密度的样本分布，需要更多的数据点，否则模型容易过拟合。

2. 维度爆炸 (Curse of Dimensionality Explosion):

维度爆炸是指在高维空间中，数据点之间的距离急剧增加，导致模型的性能下降、泛化能力减弱等问题。

计算复杂度增加: 在高维空间中，对于很多算法&

文章来源:https://blog.csdn.net/u011095039/article/details/135225955
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！