Machine Morning

機械学習やWebについて学んだことを記録しています。

誤解されがちな信頼区間

学部3年時に取った授業内で、「信頼区間(CI: Confidence Interval)の意味理解してる?」という話になり、当時自分も含め大勢の理解がいい加減だったことを思い出したので、今回はこの話題を取り上げる。ちなみにこの話題を振ってくださったのはダートマス大学で計量政治をやっている教授で、アカデミアの人間でも結構誤解している人が多いという話だったので今でも強烈に記憶に残っている。確かに実際に統計の解説記事を読むと、誤解して書かれている記事が多い。

まずよくありがちな誤解として、「95%信頼区間は95%の確率で母集団のパラメータが信頼区間に含まれるんだよね?」というものである。確か自分もこんな理解をしていた気がする。今振り返ると、誤解の原因は当時ベイズ統計学を勉強していなかったことで、母集団のパラメータのあり方について意識することがなかったからだと思う。検定をやることを目的に頻度論の初歩にしか触れていない人間には、誤解されやすいのかもしれない。

信頼区間について正しい理解をするために、まず意識しなくてはいけないことは、頻度論の枠組みでの統計学では、母集団のパラメータは真の値(唯一決まったもの)が存在し、確率変数ではないということである。このことを理解していれば、母集団のパラメータに対して確率を与えている上記の誤解がおかしいことはすぐにわかる。

95%信頼区間についての本来の正しい意味は 「繰り返し母集団から標本を抽出し信頼区間を求めると、95%の信頼区間が母集団の真のパラメータを含む」である。ここで注目すべきポイントは、確率変数は信頼区間の方であることだ。

信頼区間
出典: https://support.minitab.com/en-us/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-confidence-interval/

上図は母集団から20回サンプリングし、繰り返し信頼区間を求めると、19回は信頼区間が母集団の真の平均 \muを含み、1回は含まれないことを表している。すなわち95%信頼区間だ。

信頼区間の幅はサンプルサイズを増やせば増やすほど狭まる。これが意味するところは、母集団の真のパラメータをより精確に推定できるということだ。

ちなみにベイズ統計学では母集団のパラメータについてCredible Interval(※日本語では、信用区間や確信区間と呼ばれる)というものがあるが、上述した頻度論でのよくある誤解がCredible Intervalの正しい解釈である。ベイズ統計学では 、母集団のパラメータは事前分布に従う確率変数で真の値は存在しないと考えるからである。