2014-04-27から1日間の記事一覧

【Rによるデータサイエンス】多次元尺度法

【定義】 多次元尺度法とは。 多次元尺度法(MDS:Multi-Dimensional Scaling)は、個体間の親近性データを2次元あるいは3次元空間に、類似したものを近く、そうでないものを遠くに配置する方法である。 ここでイキナリ分からない。 親近性データとは・・・。…

Rによるデータサイエンス】対応分析

【定義】 対応分析とは。 分割表において行の項目と列の項目の相関が最大になるように、行と列の双方を並び替え、関連性が強いもの(あるいはパターンが似ているもの)同士が近似になるような値を取るように処理を行う方法。 【具体例を使用した練習】1.パ…

Rによるデータサイエンス】因子分析

【定義】 因子分析の定義は、次のように書かれている。 変数の間の相関関係から共通因子を求めること 「観測データ=独自因子+共通因子」と分解できることを前提とし、観測データを最もうまく表現する独自因子と共通因子を求めることを因子分析と呼ぶと、理…

【Rによるデータサイエンス】主成分分析 ケーススタディ

「【Rによるデータサイエンス】主成分分析」の続き。 理論的な背景を理解したので、書籍に記載のある丘本円周の例を手を動かして実践してみる。1.丘本演習の円周データをtempに作成する。 temp<-c( 50, 57, 74, 94, 112, 128, 140, 147, 150, 147, 140, 12…