2013-01-01から1年間の記事一覧

AWS EC2 でモダン開発環境の構築

Git ソースコードのバージョンを管理するために、git をインストールします。 # yum install -y openssl-devel git gcc gcc-c++ $ git --version git version 1.8.1.4git がインストールされたら、git のコマンド補完をするツールの git-completion をインス…

AWS EC2 の初期設定

AWS EC2 の初期設定で実施したことをまとめておこうと思います。 yum のアップデート AWS に初めてログインすると、「Run "sudo yum update" to apply all updates.」と出力されるので、yum を アップデートします。 # yum update -y 作業ディレクトリの作成…

クラスタリングを勉強してみる(7) BARCH

1. 概要 既存の hierarchical clustering や partitioning clustering とは異なるクラスタリング手法に、 BARCH(Balanced Interactive Reducing and Clustering using Hierarchies)[Zhang 96, Zhang 97]という手法があります。 BIRCH は、最初にデータ全体…

クラスタリングを勉強してみる(6) grid-based clustering

1. 概要 空間インデックス構造(spatial index structures)の特性をクラスタリングする手法を grid-based clustering と言います。 2. CLIQUE 下図のように、空間を間隔 で格子状に分割し、それぞれをユニットと定義します。また、ユニット中の対象の密度が…

クラスタリングを勉強してみる(5) density-based clustering

1. 概要 density-connected points などのような密度に基づいて集合を作成する手法を density-based clustering と言います。 1-1. 背景 density-based clustering を理解する上で、2つのパラメータと3つの形式定義について理解する必要があります。 1-1-1. …

クラスタリングを勉強してみる(4) hierarchical clustering

1. 概要 階層的なクラスター構造を持つ集合を作成する手法を hierarchical clustering と言います。 1-1. AGNES(Agglomerative Nesting) 凝縮型(bottom-up)によるアプローチ すべてのオブジェクトが、それぞれ1つずつのクラスターである地点から開始 最…

クラスタリングを勉強してみる(3) partitioning clustering(k-medoids)

1. k-medoids(PAM, CLARA, CLARANS) k-means は、クラスターの中心(centroid)を代表(represented object)とするのに対し、k-medoids は medoid を代表とします。medoid とは、クラスター内の点で、その点以外のクラスター内の点との非類似度の総和が最小…

クラスタリングを勉強してみる(2) partitioning clustering(k-means)

1. 概要 明確なクラスター構造を持たない集合(a flat set of clusters without any explicit structure)を作成する手法を partitioning clustering あるいは flat clustering と言います。 1-1. 目的 データ集合: 分割するクラスター数: 目的関数: の最…

クラスタリングを勉強してみる(1) クラスタリングとは

1. クラスタリングとは? クラスタリング(clustering)とはデータ(あるいはオブジェクト)集合をクラスター(cluster)と呼ばれる意味のある部分集合に分割する手法です。似たような手法に、クラス分類(classification)があります。クラス分類は、目的変…