【R】ランダムなデータの分布をヒストグラムで調べる
ランダムだと想定されるデータを分析してみる。
ランダムなデータはn行6列の行列に格納してある。
> head(random[3:8]) one two three four five six 1 2 8 10 13 27 30 2 1 9 16 20 21 43 3 1 5 15 31 36 38 4 16 18 26 27 34 40 5 9 15 21 23 27 28 6 6 12 23 25 28 38
全ての数値に対してヒストグラムを描きたいので、データをベクトルにしてからヒストグラムを描く。
> random.vec<-c(random$one,random$two,random$three,random$four,random$five,random$six) > hist(random.vec) > hist(random.vec,xlim=(c(1,50)),ylim=(c(1,869)))
40以下の数値に対しては、どの数値も600回ほど出現しており、そこに差異は無い。
40以上の数値の出現回数が少ない理由を考えたところ、40以上の数値は40〜50までを一様に与えているのではなく、40〜45までの範囲だから頻度としては半分だと考えると納得できる。
この結果を見ると、今回のデータ個数で、どの数値も一様に出現しているのかなと思う。