2014-05-02から1日間の記事一覧

【Rによるデータサイエンス】非線形回帰分析 〜 平滑化回帰

■平滑化回帰 人口データを作成する。 > x1<-seq(-10,10,0.1) > y1=50*sin(x1)+x1^2+10*rnorm(length(x1),0,1) > plot(x1,y1) データy1を目的変数、x1を説明変数とした非線形回帰モデルを考える。◎多項式回帰モデル 多項式回帰モデルで近似できないかを考える…

【Rによるデータサイエンス】非線形回帰分析 〜 一般化線形モデル

一般化線形モデルとは・・・。 wikipediaから引用したものが次。 一般化線形モデル (いっぱんかせんけいモデル、英:Generalized linear model、GLM)は、正規分布以外の分布を扱えるように線形回帰モデルを拡張したモデル。 なるほど!たしかに、これまで「【…

【R】set.seed()関数って何なのさ?

Rによるデータサイエンスを勉強していたら、頻繁に遭遇するset.seed()。 乱数生成するのに必要な理由が分からなかったけど、やっと分かった。 set.seed()は乱数種を指定する関数で、常に同じ乱数を発生させられる。もはや乱数じゃない(笑)! どういうこと…

【Rによるデータサイエンス】非線形回帰分析 〜 多項式回帰

前回「【Rによるデータサイエンス】非線形回帰分析 〜 ロジスティック回帰」では非線形回帰分析の方法の1つとしてロジスティック回帰について勉強した。今回は2つ目の方法「多項式回帰」について勉強する。次のようにして作成した人工データを使用する。 > x…

【Rによるデータサイエンス】非線形回帰分析 〜 ロジスティック回帰

非線形回帰分析とは。。。 線形回帰分析以外のことらしいw。 まぁそこは深く突っ込む気はないので、その程度に捉えておく。さて、いきなりケーススタディ。◎ロジスティック回帰 カラーテレビの普及率のデータを打ち込む。 > 年度<-c(1966:1984) > 普及率<-c…

【Rによるデータサイエンス】線形回帰分析 〜 変数・モデルの選択

回帰モデルの推定は、回帰係数を求めることだが、求めた回帰モデルの決定係数が悪かったり、残差分析の結果が悪い場合は適切なモデルとはいえない。そのため、変数を入れ替えながら回帰モデルを構築し、より当てはまりが良いモデルを選択する。それでは、良…

【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析における相互作用

「【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析」で重回帰分析について簡単に勉強した。そこでは、説明変数の間の関連性は考えずに、目的変数と説明変数間の相関関係のみを用いた。 ところが、説明変数同士にも相関関係が有る場合もあるだろう。…

【Rによるデータサイエンス】非線形回帰分析 〜 加法モデル

◎定義 加法回帰モデル(additive regression model)とは。。。 ・線形回帰モデルおよび関数nlsによる非線形回帰モデルは、加法モデルの特殊なケースと考えられる。 ・が全て線形関数の場合は、線形回帰モデルとなる。一般化線形モデルを加法モデル化したとき…