原理:根据数据点之间的距离将数据分成K个.簇,
目标是最小化每个簇内的平方误差
优点:简单,易于理解,适用于大型数据集
缺点:对初始聚类中心敏感,不适用于非凸形状的簇
示例代码:
import joblib
from sklearn.model_selection import train_test_split
from sklearn.cluster import KMeans
from get_data import get_database
if __name__ == '__main__'</