統計や確率の分野では、「成功・失敗」のような2つの結果がある試行を繰り返すことがよくあります。
例えば、「サイコロを投げて1が出るかどうか」「製品を検査して不良品かどうか」などです。
このようなケースで役に立つのが 二項分布(Binomial Distribution) です。
本記事では、二項分布の概念・数式・具体例・活用方法について、まとめます。
二項分布とは?
二項分布とは、独立した試行を一定回数繰り返したときに、特定の結果(成功)が何回発生するかを表す確率分布 です。
二項分布の特徴
- 試行の回数(\(n\))が決まっている
- 各試行の成功確率(\(p\))が一定
- 試行は独立している(1回の試行の結果が他に影響しない)
- 各試行は「成功」または「失敗」のどちらかしかない
二項分布の確率を求める式
二項分布で「\(n\)回試行して、ちょうど\(k\)回成功する確率」は、次の式で求められます。
$$P(X = k) = \frac{n!}{k!(n-k)!} p^k (1 – p)^{n – k}$$
式の説明
\(P(X = k)\)
→ちょうど \(k\) 回成功する確率
\(\frac{n!}{k!(n-k)!}\)(二項係数)
→「\(n\) 回の試行の中で \(k\) 回成功する組み合わせの数」
\(p^k\)
→成功する確率
\((1 – p)^{n – k}\)
→失敗する確率
具体例で理解する
例1:コイン投げ
「表が出る確率 \(p = 0.5\) のコインを \(3\) 回投げるとき、表が \(2\) 回出る確率は?」
計算手順
- 試行回数 \(n = 3\)
- 成功確率 \(p = 0.5\)
- 成功回数 \(k = 2\)
- 二項係数を計算
\(\frac{3!}{2!(3-2)!} = \frac{3×2×1}{2×1×1} = 3\) - 確率を求める
\(P(X = 2) = 3 × (0.5)^2 × (0.5)^1 = 3 × 0.25 × 0.5 = 0.375\)
つまり、コインを3回投げて、表がちょうど2回出る確率は 37.5% です。
例2:工場の品質管理
「不良品が出る確率が \(2%\) の製品を \(10\) 個検査したとき、不良品が \(1\) 個も出ない確率は?」
計算手順
- 試行回数 \(n = 10\)
- 成功確率(不良品が出る確率) \(p = 0.02\)
- 成功回数(不良品が0個) \(k = 0\)
- 二項係数 \(\frac{10!}{10!} = 1\)
- 確率を求める
\(P(X = 0) = 1 × (0.02)^0 × (0.98)^{10} = (0.98)^{10} ≈ 0.817\)
つまり、不良品が 1つも出ない確率は約81.7% です。
二項分布の期待値と分散
二項分布の期待値(平均)と分散は、以下の式で求められます。
- 期待値 \(E(X) = n p\)→ 試行回数 \(n\) のうち、成功する平均回数。
- 分散 \(V(X) = n p (1 – p)\)→ 成功回数のばらつきを表す。
- 標準偏差 \(\sigma(X) = \sqrt{n p (1 – p)}\)
二項分布の活用例
マーケティング
ある広告のクリック率が 5% の場合、1000 人が広告を見たときに 50 人がクリックする確率 を求める。
医療統計
ワクチンの有効率が 90% のとき、1000 人接種した場合に 900 人が効果を得る確率 を計算する。
品質管理
製造ラインで 不良品率 1% の製品を 500 個検査したとき、不良品が 5 個以下の確率 を調べる。
二項分布と正規分布の関係
試行回数 \(n\) が大きくなると、二項分布は正規分布に近づく という性質があります。(中心極限定理)
$$X \sim B(n, p) \quad \text{(二項分布)}$$
が、
$$X \sim N(n p, \sqrt{n p (1 – p)}) \quad \text{(正規分布)}$$
に近づきます。
この性質を使うと、大きな \(n\) のときに二項分布の確率を 正規分布の近似 で求めることができます。
まとめ
二項分布とは「成功 or 失敗」のような試行を繰り返し、成功回数の確率を求める分布です。広告のクリック率、品質管理、医療統計など様々な分野で応用されています。