什么是聚类算法
聚类是一种机器学习技术,它涉及到数据点的分组。给定一组数据点,我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法,是许多领域中常用的统计数据分析技术。
高斯混合聚类(GMM)
GMM在EM算法一节介绍。下面K-Means的推导也会用到GMM。
K均值聚类(K-Means)
K-Means是最基础和普及的聚类算法,需要事先指定聚类数K,算法流程为: