統計学において、私たちが知りたいのは「母集団(全体)の平均値」「母集団の割合」「母集団の相関係数」といった母数です。しかし、通常は母集団すべてを調べられないため、標本(サンプル)をとってその特徴から母数を推定します。
たとえば、ある地域の平均身長が知りたいとき、地域全員の身長を測るのは不可能または非効率的なので、何人かを無作為に抽出してその平均をとり、「母集団の平均はこのくらいだろう」と推定します。
ただし、サンプルから計算した平均値には、どうしても不確実性がつきまといます。
母集団の平均が「ちょうどサンプル平均と同じ」という保証はありません。そこで、母数の推定値に「どのくらいの幅で本当の値が存在しそうか」を示すために信頼区間(Confidence Interval:CI)という考え方が使われます。
信頼区間とは何か?
信頼区間の直感的なイメージ
信頼区間の直感的なイメージは、以下のような範囲です。
母集団の真の値(平均など)が、ある確率でこの範囲に入っている。
たとえば「95%信頼区間」ならば、理想的に何度も同じように調査を繰り返したときに、約95%の割合でその区間に真の母数が含まれるはず、という考え方です。
「この区間に真の値が95%の確率で入っている」 というよりは、統計的には
この方法で何度も区間を作れば、母数を含む区間が約95%になる。
と理解します。
「信頼度」をどう決めるか?
信頼区間には「95%」だけでなく「90%」「99%」など、さまざまな選択が可能です。
一般的には「95%」がよく使われますが、場面によっては、正確さ重視で 99% を使うこともあれば、調査コストやスピードを優先して 90% を使うこともあります。
- 信頼度を高くする(例:99%)
⇒ 区間の幅が広くなる(安全だけどどこにでも当てはまりそう…という印象) - 信頼度を低くする(例:90%)
⇒ 区間の幅が狭くなる(精密だけど「間違っているかもしれない」リスクが高くなる)
信頼区間の例 母平均の推定
一番シンプルな例として、「母平均」を推定する場合を考えてみます。
サンプル数 \(n\) の標本を取り、その標本平均を \(\bar{X}\) とします。母平均 \(\mu\) を知りたいとします。
母分散が既知の場合
もしも母集団の分散 \(\sigma^2\) が既に分かっている場合、標本平均 \(\bar{X}\) は正規分布に従うと仮定すると(中心極限定理を使うなどの仮定)、95%信頼区間は以下のとおりとなります。
$$\bar{X} \pm 1.96 \times \frac{\sigma}{\sqrt{n}}$$
ここで、1.96 という数字は、標準正規分布(平均0、分散1の正規分布)の約97.5パーセンタイル点(片側2.5%を超えるところ)の値です。
- 「95%」というのは、区間の上下で 2.5%+2.5%=5% の確率質量を除外していることに対応します。
- \(\frac{\sigma}{\sqrt{n}}\) は標準誤差(SE)と呼ばれ、母平均を推定する際のばらつきの大きさを表します。
母分散が未知の場合
現実的には母分散 \(\sigma^2\)σ2 はほとんど知られていません。このときはサンプルから不偏分散 \(s^2\) を計算し、その平方根 \(s\) を用います。ただし、サンプルサイズが小さい場合には、\(s\) を用いると推定にさらなる誤差が生じるため、理想的にはt分布を使って区間推定を行います。
サンプルサイズ \(n\) のとき、t分布の自由度は通常 \(n – 1\) となります。
t分布の 95% 信頼区間は
$$\bar{X} \pm t_{\alpha/2,\, n-1} \times \frac{s}{\sqrt{n}}$$
となります。
ここで \(t_{\alpha/2,\, n-1}\) は自由度 \(n-1\) の t分布における上側確率 \(\alpha/2\)(たとえば \(\alpha = 0.05\) なら 0.025)の点です。
サンプルサイズが大きいと t分布は正規分布に近づき、 \(t_{\alpha/2,\, n-1}\) と 1.96 はほぼ同じになります。
母数は固定されていて変動するのはサンプルである、というのが基本的な考え方です。
実用例
身長の信頼区間(母集団:大学生)
たとえば、ある大学の学生(母集団)の平均身長を知りたいとします。男女混合・学部学年もバラバラな全学生を母集団とし、そこから無作為に 100 人を選んだとします。得られたサンプル(標本)の平均身長が 170 cm、サンプルの標準偏差(不偏推定量)が 6 cm だったとします。
- サンプルサイズ \(n = 100\)
- 標本平均 \(\bar{X} = 170\)
- 標本標準偏差 \(s = 6\) cm
ここで、95%信頼区間を計算するには t分布を用います。自由度は \(100 – 1 = 99\)。t分布表や統計ソフトを使うと、自由度 99 のときの 97.5 パーセンタイル点(両側 2.5%)は、およそ 1.984 です。
以上により、95%信頼区間は
$$170 \pm 1.984 \times \frac{6}{\sqrt{100}} = 170 \pm 1.984 \times 0.6$$
$$1.984 \times 0.6 = 1.1904 \approx 1.19$$
よって、おおよそ
$${CI}_{95\%} = [168.81,\; 171.19]$$
となります。
つまり、170cmという推定値を中心として、約168.8cm〜171.2cmの範囲に、母平均が含まれる可能性が高い、といえます。
信頼区間と統計的仮説検定の関係
信頼区間は、統計的仮説検定(例えば「母平均が 170 cm かどうか」を検証するなど)と密接な関係があります。たとえば、「ある特定の値 \(\mu_0\) を真の平均として仮定したときに、95%信頼区間の外にその値がある場合、その値は 5%の有意水準で棄却される」という対応があります。
- 「真の平均が 170 cm であると仮定したとき、その値が 95%信頼区間の外にあれば、有意水準 5%でその仮説は棄却される」
- 逆に、「その値が区間の中に入っていれば、有意水準 5%では棄却できない」
これによって、推定(区間推定)と検定(有意性検定)の結びつきを把握できます。
ポイント
- 信頼区間は“母数”の不確実性を表す
サンプルから得られる推定値には必ず誤差があり、その誤差を反映した「幅」として信頼区間が存在します。 - 頻度論では「繰り返したときに95%含まれる」
古典的な統計学(頻度論)では、信頼区間はあくまでも「区間構成法を繰り返したときに約95%が真の母平均を含むような区間」を意味します。 - サンプルサイズが増えると精度は上がる
サンプルサイズ \(n\) が大きくなるほど \(\frac{1}{\sqrt{n}}\) が小さくなり、区間の幅は狭くなります。 - 信頼度を上げると区間が広がる
99%信頼区間や 99.9%信頼区間など、より高い信頼度をとるほど区間は広くなります。逆に 90%にすると区間は狭くなりますが、含まれる確率が低くなります。 - 母平均だけでなく、母比率や回帰係数などにも適用可能
信頼区間の考え方は、平均値だけでなく、母比率(母集団における割合)や回帰係数の推定、その他さまざまな統計量に応用できます。
まとめ
信頼区間は、統計解析を行ううえで欠かせない概念であり、「推定したい母数の真の値がどの程度の範囲にあるか」を可視化してくれます。特に「サンプル平均などの推定値 ±(誤差の指標)」という形で表されるので直感的にも理解しやすく、結果を相手に伝えるうえでも便利です。
- サンプルの大きさ(n)
- 信頼度(95%、99% など)
- 推定に用いる分布(正規分布、t分布 など)
といった要素によって、求められる信頼区間の幅が変わってきます。統計的に結果を報告するときには、推定値と同時にこの信頼区間を示すことで、より情報を正しく伝えることができます。