クラスタリングを勉強してみる(1) クラスタリングとは

1. クラスタリングとは?

クラスタリング(clustering)とはデータ(あるいはオブジェクト)集合をクラスター(cluster)と呼ばれる意味のある部分集合に分割する手法です。似たような手法に、クラス分類(classification)があります。

クラス分類は、目的変数のある教師あり(supervised)分類法であるのに対し、クラスタリングは、目的変数のない教師なし(unsupervised)分類法を指します。

1-1. クラスタリング手法の分類

  • partitioning algorithms
  • hierarchical algorithms
  • density-based
  • grid-based
  • model-based method

f:id:somathor:20130423191121j:plain