【統計学入門】データのバラツキの大きさを測る各種指標

データのバラツキを測る指標を次にまとめる。なお、「データのバラツキを測る」というのは、中心値や代表値を基準として、各種データがそこからどの程度離れているのかを調べるということ。

タイトル バラツキを測る指標名 内容
偏差と分散 偏差 各データと平均値の差
分散 偏差の2乗の平均値
標準偏差 分散の平方根平方根をとる1つの理由は、元のデータと単位を揃える意味があるだけ。
偏差平方和への分解 偏差平方和(総平方和) 平均値と個々のデータの偏差平方和(観測値全体でのバラツキ)。グループ間平方和とグループ内平方和を足したものに等しい。
偏差平方和(グループ間平方和) グループ平均値と個々のデータの偏差の平方和(グループ別平均のバラツキ)
偏差平方和(グループ内平方和) 全体の平均値とグループ平均値との差の平方和(グループ内での観測値のバラツキ)
分散分析 分散分析 複数の平均値の比較を行うための検定
平均平方 各平方和をその自由度で割った値
変動係数(誤差率) 変動係数 標準偏差を平均値で割った量
ジニ係数 ジニ係数 所得の格差を測るための尺度(バラツキの尺度)。平均差と平均の2倍との比。
エントロピー エントロピー カテゴリのバラツキの大きさを評価する尺度

だいぶ雑にとりあえず纏めたってだけになった。必要な時に詳しく勉強する。。。