Search on the blog

2014年1月22日水曜日

大数の法則と中心極限定理をサイコロで確認してみる

 大数の法則(law of large numbers)と中心極限定理(central limit theorem)をサイコロで確認してみました。

大数の法則
大数の法則とは簡単に言うと以下のような法則です。

標本サイズを十分に大きくすると、標本平均は母平均に収束する。

ということで、サイコロ振りまくって標本サイズと標本平均の関係を下表にまとめてみました。
標本サイズ 標本平均
10 2.600
100 3.950
1,000 3.467
10,000 3.525
100,000 3.504
1,000,000 3.502
法則どおり、標本サイズを大きくしていくと母平均の3.5に収束していきました。

中心極限定理
中心極限定理は簡単にいうと以下のような定理です。

母集団の分布がどのようなものであっても、標本サイズを十分に大きくすると、母平均と標本平均の誤差は正規分布に従う。

簡単な例としてサイコロを2回ふって標本平均を算出する場合を考えます。
サイコロの目が(3, 4)だと標本平均は3.5になります。同様に(1, 6), (2, 5)の場合でも3.5になります。しかし(1,1)だと標本平均は1.0になります。
このように標本サイズが同じでも観測される事象によって標本平均は変化します。中心極限定理はこの確率的に変化する標本平均がどのような分布になるかについて言及しています。この定理のおもしろいところは「母集団の分布がどのようなものであっても」という枕詞の部分だと思います。

ということで、サイコロ振りまくって標本平均の分布をグラフにプロットしてみました。母集団の分布は離散一様分布であることに注意してください。

上からサンプル数=1, 3, 10です。



定理どおり正規分布の形になりました(※上のグラフにプロットしているのは標本平均の分布です。定理どおりに母平均との誤差をプロットしたグラフは3.5だけx軸負方向にシフトしたものになります)。
また、標本サイズを大きくすることで分散が小さくなっていることも確認できました。

0 件のコメント:

コメントを投稿