题目标题

KMeans 初始类簇中心点的选取

难度:初级

机器学习
参考解析

K-means++算法选择初始 seeds 的基本思想就是:初始的聚类中心之间的相
互距离要尽可能的远。
从输入的数据点集合中随机选择一个点作为第一个聚类中心
2.对于数据集中的每一个点 x,计算它与最近聚类中心(指已选择的聚类中心)的
距离 D(x)
3.选择一个新的数据点作为新的聚类中心,选择的原则是:D(x)较大的点,被
选取作为聚类中心的概率较大
4.重复 2 和 3 直到 k 个聚类中心被选出来
5.利用这 k 个初始的聚类中心来运行标准的 k-means 算法