2008年6月25日

如何自动确定聚类的最佳类别数?

这是个很热门的研究点,有空弄弄看。

现在知道的有四种方案(无任何先验知识):

Spectral Graph Clustering 中可以使用Modularity(Newman, 2004)

k-means and agglomerative hierarchical clustering中可用Elbow criterion(http://en.wikipedia.org/wiki/Cluster_analysis

还有人建议"gap method" or "l-method"。

 

有点意思,备份一下。

1 条评论: