【R】ランダムなデータの分布をヒストグラムで調べる

ランダムだと想定されるデータを分析してみる。
ランダムなデータはn行6列の行列に格納してある。

> head(random[3:8])
  one  two three four five six
1   2   8    10   13   27  30
2   1   9    16   20   21  43
3   1   5    15   31   36  38
4  16  18    26   27   34  40
5   9  15    21   23   27  28
6   6  12    23   25   28  38

全ての数値に対してヒストグラムを描きたいので、データをベクトルにしてからヒストグラムを描く。

> random.vec<-c(random$one,random$two,random$three,random$four,random$five,random$six)
> hist(random.vec)
> hist(random.vec,xlim=(c(1,50)),ylim=(c(1,869)))


40以下の数値に対しては、どの数値も600回ほど出現しており、そこに差異は無い。
40以上の数値の出現回数が少ない理由を考えたところ、40以上の数値は40〜50までを一様に与えているのではなく、40〜45までの範囲だから頻度としては半分だと考えると納得できる。

この結果を見ると、今回のデータ個数で、どの数値も一様に出現しているのかなと思う。