然后我们来看一下这个DBSCAN可以看到上面动画演示了,他聚类的过程
可以看到对于一些离群点他会自动的计算出来并且过滤掉,清洗掉,这些离群点,也就是异常值对吧
我们要找到的是一般规律,需要一个具有普适性的模型,对于特殊的离群的,异常的值应该会自动忽略掉
然后我们首先导包
import numpy as np 数学计算包
import matplotlib.pyplot as plt 画图包
fromt sklearn.cluster import KMeans,DBSCAN 聚类算法KMeans DBSCAN聚类算法
from sklearn import datasets 导入数据集包
上一节我们对DBSCAN的原理进行了说明,然后现在我们
对他的参数来看一下,我们按下shift tab
首先我们看这里的eps参数,min_samples=5这个参数 metric这个参