2013-04-23から1日間の記事一覧

クラスタリングを勉強してみる(7) BARCH

1. 概要 既存の hierarchical clustering や partitioning clustering とは異なるクラスタリング手法に、 BARCH(Balanced Interactive Reducing and Clustering using Hierarchies)[Zhang 96, Zhang 97]という手法があります。 BIRCH は、最初にデータ全体…

クラスタリングを勉強してみる(6) grid-based clustering

1. 概要 空間インデックス構造(spatial index structures)の特性をクラスタリングする手法を grid-based clustering と言います。 2. CLIQUE 下図のように、空間を間隔 で格子状に分割し、それぞれをユニットと定義します。また、ユニット中の対象の密度が…

クラスタリングを勉強してみる(5) density-based clustering

1. 概要 density-connected points などのような密度に基づいて集合を作成する手法を density-based clustering と言います。 1-1. 背景 density-based clustering を理解する上で、2つのパラメータと3つの形式定義について理解する必要があります。 1-1-1. …

クラスタリングを勉強してみる(4) hierarchical clustering

1. 概要 階層的なクラスター構造を持つ集合を作成する手法を hierarchical clustering と言います。 1-1. AGNES(Agglomerative Nesting) 凝縮型(bottom-up)によるアプローチ すべてのオブジェクトが、それぞれ1つずつのクラスターである地点から開始 最…

クラスタリングを勉強してみる(3) partitioning clustering(k-medoids)

1. k-medoids(PAM, CLARA, CLARANS) k-means は、クラスターの中心(centroid)を代表(represented object)とするのに対し、k-medoids は medoid を代表とします。medoid とは、クラスター内の点で、その点以外のクラスター内の点との非類似度の総和が最小…

クラスタリングを勉強してみる(2) partitioning clustering(k-means)

1. 概要 明確なクラスター構造を持たない集合(a flat set of clusters without any explicit structure)を作成する手法を partitioning clustering あるいは flat clustering と言います。 1-1. 目的 データ集合: 分割するクラスター数: 目的関数: の最…

クラスタリングを勉強してみる(1) クラスタリングとは

1. クラスタリングとは? クラスタリング(clustering)とはデータ(あるいはオブジェクト)集合をクラスター(cluster)と呼ばれる意味のある部分集合に分割する手法です。似たような手法に、クラス分類(classification)があります。クラス分類は、目的変…