在本节中,我们将使用scikit-learn进行基于凝聚的层次聚类。不过,scikit-learn中已经实现了一个AgglomerativeClustering类,它允许我们选择待返回簇的数量。当我们想要对层次聚类树进行剪枝时,这个功能是非常有用的。将参数n_cluster的值设定为2,我们可以采用与前面相同的完全连接方法,基于欧几里得距离矩阵,将样本划分为两个簇:
通过对簇类标的预测结果进行分析,我们可以看出:第一、第四、第五个(ID_0,ID_3和ID_4)样本被划分至第一个簇(0),样本ID_1和ID_2被划分至第二个簇(1),这与此前通过树状图得到的结果一致。