統計分析

Rによるデータサイエンス】対応分析

【定義】 対応分析とは。 分割表において行の項目と列の項目の相関が最大になるように、行と列の双方を並び替え、関連性が強いもの(あるいはパターンが似ているもの)同士が近似になるような値を取るように処理を行う方法。 【具体例を使用した練習】1.パ…

Rによるデータサイエンス】因子分析

【定義】 因子分析の定義は、次のように書かれている。 変数の間の相関関係から共通因子を求めること 「観測データ=独自因子+共通因子」と分解できることを前提とし、観測データを最もうまく表現する独自因子と共通因子を求めることを因子分析と呼ぶと、理…

【Rによるデータサイエンス】主成分分析 ケーススタディ

「【Rによるデータサイエンス】主成分分析」の続き。 理論的な背景を理解したので、書籍に記載のある丘本円周の例を手を動かして実践してみる。1.丘本演習の円周データをtempに作成する。 temp<-c( 50, 57, 74, 94, 112, 128, 140, 147, 150, 147, 140, 12…

【Rによるデータサイエンス】主成分分析

主成分分析について、本には次のように記載がある。 主成分分析(PCA:Principa Component Analysis)は、多くの変数により記述された量的データの変数間の相関を排除し、できるだけ少ない情報の損失で、少数この無相関である合成変数に縮約して、分析を行う…