【統計学入門】データのバラツキの大きさを測る各種指標
データのバラツキを測る指標を次にまとめる。なお、「データのバラツキを測る」というのは、中心値や代表値を基準として、各種データがそこからどの程度離れているのかを調べるということ。
タイトル | バラツキを測る指標名 | 内容 |
偏差と分散 | 偏差 | 各データと平均値の差 |
分散 | 偏差の2乗の平均値 | |
標準偏差 | 分散の平方根。平方根をとる1つの理由は、元のデータと単位を揃える意味があるだけ。 | |
偏差平方和への分解 | 偏差平方和(総平方和) | 平均値と個々のデータの偏差平方和(観測値全体でのバラツキ)。グループ間平方和とグループ内平方和を足したものに等しい。 |
偏差平方和(グループ間平方和) | グループ平均値と個々のデータの偏差の平方和(グループ別平均のバラツキ) | |
偏差平方和(グループ内平方和) | 全体の平均値とグループ平均値との差の平方和(グループ内での観測値のバラツキ) | |
分散分析 | 分散分析 | 複数の平均値の比較を行うための検定 |
平均平方 | 各平方和をその自由度で割った値 | |
変動係数(誤差率) | 変動係数 | 標準偏差を平均値で割った量 |
ジニ係数 | ジニ係数 | 所得の格差を測るための尺度(バラツキの尺度)。平均差と平均の2倍との比。 |
エントロピー | エントロピー | カテゴリのバラツキの大きさを評価する尺度 |
だいぶ雑にとりあえず纏めたってだけになった。必要な時に詳しく勉強する。。。