乱数を使って、区間推定の信頼区間が妥当であるかどうかを実験してみましょう。
ここでは、母集団は正規分布にしたがい、その平均は170、標準偏差が10とします。また、大きさ5の標本抽出を考えます。このとき、平均の95%信頼区間は
それでは、Excelを使って、この正規母集団から、大きさ5の標本抽出を10000回繰り返してみましょう。分析ツールの乱数発生を選択し、次のように値を設定してください。
10000行5列の正規乱数が生成されます。ここで、各行が1回の標本抽出の結果とみなしましょう。
次に、各標本抽出によって得られた標本から95%信頼区間を求めます。F列に信頼区間の下限を、G列に上限を計算します。
F1,G1の式をF10000,G10000まで下方向へコピーします。
この結果をみると、1回目の標本抽出による95%信頼区間は[163.43,180.96]、2回目の標本抽出による95%信頼区間は[160.89,178.42]になります。母集団の平均は170なので、両者とも母集団の平均を区間に含んでいることになります。(注:皆さんの数値はこの例題と若干異なるかもしれませんが、正常に動作していますので、先に進んでください)
次に、1万回のの標本抽出によって求められた1万の95%信頼区間が、母集団の平均を含んでいる割合を計算しましょう。理論が正しければ、1万中、9500が母集団の平均を含んでいるはずです。
H1に次のような式を入力します。
もし、F1,G1からなる信頼区間が母集団の平均である170を含めば、「TRUE」、そうでなければ「FALSE」と表示されるはずです。
H1の式をH10000まで下方向にコピーしてください。
TRUEがほとんどですが、たまにFALSEとなっているセルがあることがわかると思います。
それでは、実際にTRUEがいくつあるか数えてみましょう。H10001に次の式を入力します。
私の結果では、1万回中9477回、つまり94.77%が母集団の平均を含むという結果になりました。これは理論値である95%に非常に近い値です。
このように、95%信頼区間というのは、もし母集団からの標本中抽出が何回でも行える(実際問題ではそのようなことは稀ですが)ならば、各回の標本平均から得られる信頼区間に母集団平均が含まれる割合が95%だということです。

コメントする