K邻近是一种分类算法,其思路是计算离该类别最近的K条数据的类别,来标记该数据的类别
!别
KNN:
? KNN算法主要是用于解决监督学习中的分类问题
? 其数据集是由特征值和目标值组成,使用的数据是已经标记过的数据
? KNN算法是一种懒惰算法,没有明显的前期训练过程
? 里面的K值表示把这个样本点分到哪个类别的参考数据点
K-Means:
? k-means算法主要是用于解决无监督学习问题
? 其数据集只有特征值,使用的数据是杂乱无序的,经过聚类之后才会变得稍微有点顺序
? 前期有明显的训练过程
? 里面的K值表示最后要聚成几类
KNN和K-Means的相似点:
两者计算的过程,都包含在数据集中找离其最近的点,然后进行判断。