然后我们再来看一种聚类的算法可以看到就是这种分层聚类算法
可以看到它的原理就是,首先聚成小类,比如 白杏和红杏 靠的比较近 就分为一类了,然后
这种聚合的小类,再按照他们类别之间的距离,再合并,不断下去 最后把 子类都聚合成一个大类 这样的聚类原理
可以看到当考虑聚类效率的时候,我们选择的是平面聚类算法,之前我们用的KMeans就是一种平面聚类算法,平面聚类存在潜在问题,不够结构化 层次聚类会更好
可以看到层次聚类的原理,我们再看一下
首先,把离得比较近的,可以看到上面 几个离得近的红点 算为了一类,然后紫色的点离得比较近,算为了一类,然后绿色的点离得比较近,又算为了一类,然后
这两个子类红色和紫色 类放在一起以后, 就变成了一个大类对吧. 可以看到,分层聚类,就像一颗树一样,有结构的.
是由少到多,由下到上的
然后我们来看一下层次距离