データ分析

【Rによるデータサイエンス】非線形回帰分析 〜 一般化線形モデル

一般化線形モデルとは・・・。 wikipediaから引用したものが次。 一般化線形モデル (いっぱんかせんけいモデル、英:Generalized linear model、GLM)は、正規分布以外の分布を扱えるように線形回帰モデルを拡張したモデル。 なるほど!たしかに、これまで「【…

【Rによるデータサイエンス】非線形回帰分析 〜 多項式回帰

前回「【Rによるデータサイエンス】非線形回帰分析 〜 ロジスティック回帰」では非線形回帰分析の方法の1つとしてロジスティック回帰について勉強した。今回は2つ目の方法「多項式回帰」について勉強する。次のようにして作成した人工データを使用する。 > x…

【Rによるデータサイエンス】非線形回帰分析 〜 加法モデル

◎定義 加法回帰モデル(additive regression model)とは。。。 ・線形回帰モデルおよび関数nlsによる非線形回帰モデルは、加法モデルの特殊なケースと考えられる。 ・が全て線形関数の場合は、線形回帰モデルとなる。一般化線形モデルを加法モデル化したとき…

【Rによるデータサイエンス】線形回帰分析 〜 線形単回帰分析

【定義】 回帰分析とは。。。 回帰分析とは、説明変数を用いて、目的変数を説明する統計モデルをデータから求めるデータ分析の方法。 回帰分析には2種類あり、 直線関係でモデル化する回帰分析を線形回帰分析と呼ぶ。 非線形関係でモデル化する回帰分析を非…

【Rによるデータサイエンス】線形回帰分析 〜 重回帰分析

前回は線形回帰分析のうち、線形単回帰分析について勉強した。今回は、重回帰分析について勉強する。 重回帰分析とは、説明変数が複数である回帰分析のこと。 次のように表現できることを想定する。 回帰分析で求める回帰式は次。 説明変数のデータをX、目的…

【Rによるデータサイエンス】クラスター分析

【定義】 クラスター分析とは。。。 ざっくり言うと次のようになる。 クラスター分析とは、データのパターンが似ている個体を同じグループにまとめる分析方法である。 簡単そう! でも、データのパターンの定量的定義はどうするの?とか、パターンの違いはど…

【Rによるデータサイエンス】多次元尺度法

【定義】 多次元尺度法とは。 多次元尺度法(MDS:Multi-Dimensional Scaling)は、個体間の親近性データを2次元あるいは3次元空間に、類似したものを近く、そうでないものを遠くに配置する方法である。 ここでイキナリ分からない。 親近性データとは・・・。…

Rによるデータサイエンス】対応分析

【定義】 対応分析とは。 分割表において行の項目と列の項目の相関が最大になるように、行と列の双方を並び替え、関連性が強いもの(あるいはパターンが似ているもの)同士が近似になるような値を取るように処理を行う方法。 【具体例を使用した練習】1.パ…

Rによるデータサイエンス】因子分析

【定義】 因子分析の定義は、次のように書かれている。 変数の間の相関関係から共通因子を求めること 「観測データ=独自因子+共通因子」と分解できることを前提とし、観測データを最もうまく表現する独自因子と共通因子を求めることを因子分析と呼ぶと、理…

【Rによるデータサイエンス】第2章 データの入出力と編集

◎ベクトルと長さ 長さはlengthを用いる。 > sales<-c(15,20,25,10,30) > length(sales) [1] 5 ◎ベクトルのラベル 文字ベクトルを数値ベクトルの各要素のラベルとして付け加える。 > fruits<-c("なし","林檎","葡萄","桃","その他") > names(sales)<-fruits >…

【Rによるデータサイエンス】第1章 データマイニングとR言語

◎代入 > x<-c(1,2,3,4,5) > x [1] 1 2 3 4 5 ◎自作関数 関数の名前<-function(引数){ プログラム本体 } ◎パッケージ操作 ・既にインストール済みのパッケージの確認 library(); ・読み込み済みで利用可能なパッケージの確認 search(); パッケージMASSの、対…

時系列データ分析の本を読んでの整理4

「時系列データ分析の本を読んでの整理3」の続き。 本はこれ。現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~作者: 横内大介,青木義充出版社/メーカー: 技術評論社発売日: 2014/02/18メディア: 単行本(ソフトカバー)この商品…

時系列データ分析の本を読んでの整理3

「時系列データ分析の本を読んでの整理2」の続き。本はこれ。現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~作者: 横内大介,青木義充出版社/メーカー: 技術評論社発売日: 2014/02/18メディア: 単行本(ソフトカバー)この商品…

時系列データ分析の本を読んでの整理2

「時系列データ分析の本を読んでの整理1」の続き。本はこれ。現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~作者: 横内大介,青木義充出版社/メーカー: 技術評論社発売日: 2014/02/18メディア: 単行本(ソフトカバー)この商品…

時系列データ分析の本を読んでの整理1

読んだ本は、これ。現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~作者: 横内大介,青木義充出版社/メーカー: 技術評論社発売日: 2014/02/18メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見るslideshareにメ…