Machine Morning

機械学習やWebについて学んだことを記録しています。

標本平均の分散はなぜサンプルサイズnで割るのか

標本平均の分散 \dfrac {\sigma ^{2}}{n} (ただし \sigma ^{2}は母分散、 nはサンプルサイズ)がなぜこのような形になっているのか。

結論から言うと、サンプルサイズ nが大きければ標本平均の分散 V\left[\overline {x}\right]は0に収束し、標本平均の期待値 E\left[ \overline {x}\right]が母平均 \muに収束するからである。これは大数の法則が主張したいことそのものである。

母集団から任意のサンプルサイズ n個の標本を無作為に抽出し、その標本平均 \overline {x}を求める。この復元抽出を繰り返し行い、毎回の標本平均 \overline {x}を求め、標本平均の分散 V\left[\overline {x}\right]を求める。 例えば、サンプルサイズ n 2個や 3個といった小さな数で抽出を繰り返せば、標本平均 \overline {x}は毎回大きく違った値を取ることが予想される。 反対に、サンプルサイズ nを増やし 10000 100000000などといったたくさんの標本を抽出することで、毎回似たような標本平均が得られることが予想できる。 抽出する数 nを増やせば増やすほど、標本平均の分散 V\left[\overline{x} \right] 0に収束し、標本平均 \overline {x}は母平均 \muに収束する。

したがって、標本平均の分散 \dfrac {\sigma ^{2}}{n}は分母にサンプルサイズ nがあることで、サンプルサイズが n\rightarrow \inftyのとき分散が 0に収束し、標本平均が母平均と一致することを表している。

参考

amzn.asia

p.183, 184