2014-05-01から1ヶ月間の記事一覧

【Rによるデータサイエンス】非線形回帰分析 〜 多項式回帰

前回「【Rによるデータサイエンス】非線形回帰分析 〜 ロジスティック回帰」では非線形回帰分析の方法の1つとしてロジスティック回帰について勉強した。今回は2つ目の方法「多項式回帰」について勉強する。次のようにして作成した人工データを使用する。 > x…

【Rによるデータサイエンス】非線形回帰分析 〜 ロジスティック回帰

非線形回帰分析とは。。。 線形回帰分析以外のことらしいw。 まぁそこは深く突っ込む気はないので、その程度に捉えておく。さて、いきなりケーススタディ。◎ロジスティック回帰 カラーテレビの普及率のデータを打ち込む。 > 年度<-c(1966:1984) > 普及率<-c…

【Rによるデータサイエンス】線形回帰分析 〜 変数・モデルの選択

回帰モデルの推定は、回帰係数を求めることだが、求めた回帰モデルの決定係数が悪かったり、残差分析の結果が悪い場合は適切なモデルとはいえない。そのため、変数を入れ替えながら回帰モデルを構築し、より当てはまりが良いモデルを選択する。それでは、良…

【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析における相互作用

「【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析」で重回帰分析について簡単に勉強した。そこでは、説明変数の間の関連性は考えずに、目的変数と説明変数間の相関関係のみを用いた。 ところが、説明変数同士にも相関関係が有る場合もあるだろう。…

【Rによるデータサイエンス】非線形回帰分析 〜 加法モデル

◎定義 加法回帰モデル(additive regression model)とは。。。 ・線形回帰モデルおよび関数nlsによる非線形回帰モデルは、加法モデルの特殊なケースと考えられる。 ・が全て線形関数の場合は、線形回帰モデルとなる。一般化線形モデルを加法モデル化したとき…

【Rによるデータサイエンス】線形回帰分析 〜 線形単回帰分析

【定義】 回帰分析とは。。。 回帰分析とは、説明変数を用いて、目的変数を説明する統計モデルをデータから求めるデータ分析の方法。 回帰分析には2種類あり、 直線関係でモデル化する回帰分析を線形回帰分析と呼ぶ。 非線形関係でモデル化する回帰分析を非…

【Rによるデータサイエンス】自己組織化マップ(SOM)

【定義】 自己組織化マップとは。。。 ニューラルネットワークの1種で、目的変数を持たない教師なし学習アルゴリズムのこと。 高次元データを2次元平面上へ非線形射影するデータ解析手法。 ニューラルネットワークとは。。。 Wikipediaによると次のようにあ…

【Rによるデータサイエンス】クラスター分析(つづき) 〜 非階層的クラスター分析

「【Rによるデータサイエンス】クラスター分析」では、クラスター分析の定義から入り、階層的クラスター分析のケーススタディまで行った。 今回は、階層的クラスター分析が適さない場合に使用する、非階層的クラスター分析についてメモする。 まず、階層的ク…

【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析

前回は線形回帰分析のうち、線形単回帰分析について勉強した。今回は、重回帰分析について勉強する。 重回帰分析とは、説明変数が複数である回帰分析のこと。 次のように表現できることを想定する。 回帰分析で求める回帰式は次。 説明変数のデータをX、目的…