統計学における期待値(Expected Value)とは、確率分布における平均的な値のことを指します。
これは、確率的な試行を繰り返したときに、長期的に得られる平均的な結果を示します。
例えば、サイコロを振る場合、出る目の平均的な値を求めることができます。
これが期待値の概念です。
期待値の定義
期待値 \(E(X)\) は、確率変数 \(X\) の値とその確率の積の総和(または積分)で表されます。
離散型確率分布の場合
$$E(X) = \sum_{i} x_i P(X = x_i)$$
ここで、\(x_i\) は確率変数の取る値、\(P(X = x_i)\) はその値が出る確率です。
連続型確率分布の場合
$$E(X) = \int_{-\infty}^{\infty} x f(x) dx$$
ここで、\(f(x)\) は確率密度関数です。
期待値の具体例
サイコロの期待値
6面サイコロを振るとき、出る目の期待値を求めてみます。
- 出る目の値:\(1, 2, 3, 4, 5, 6\)
- 各目の確率:\(\frac{1}{6}\)
期待値は次のように計算できます。
$$E(X) = 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6}$$
$$= \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = \frac{21}{6} = 3.5$$
この結果から、サイコロを長期的に振り続けると、平均して3.5の目が出ると期待できます。
コイン投げの期待値
コインを投げたときに、表を1点、裏を0点とすると、期待値は次のように求められます。
- 表が出る確率:\(\frac{1}{2}\)
- 裏が出る確率:\(\frac{1}{2}\)
$$E(X) = 1 \times \frac{1}{2} + 0 \times \frac{1}{2} = \frac{1}{2}$$
つまり、コインを何度も投げると、1回あたりの平均的な得点は0.5になります。
期待値の性質
線形性
期待値は線形性を持ちます。
つまり、確率変数 \(X\) と \(Y\) に対して、
$$E(aX + bY) = aE(X) + bE(Y)$$
が成り立ちます。
期待値と分散の関係
期待値はデータの中心的な傾向を表しますが、分散はデータの広がりを示します。
期待値が同じでも、データのばらつきが異なる場合があります。
条件付き期待値
ある条件が与えられた場合の期待値を求めることができます。
例えば、サイコロで偶数の目が出たときの期待値を求める場合などです。
期待値の応用
期待値は統計学だけでなく、ビジネス、経済学、ギャンブル、機械学習などさまざまな分野で活用されています。
投資の期待リターン
株式投資において、リターン(利益)が確率的に変動する場合、その平均的な収益を予測するために期待値が使われます。
例えば、ある株が以下のようなリターンを持つとします。
- 10% の確率で 20% の利益
- 60% の確率で 5% の利益
- 30% の確率で -10% の損失
期待リターンは次のように計算されます。
$$E(X) = 0.1 \times 20 + 0.6 \times 5 + 0.3 \times (-10) = 2 + 3 – 3 = 2%$$
この結果から、この株式の長期的な平均リターンは2%と期待できます。
保険のリスク計算
保険会社は、事故発生確率や支払額の期待値を計算し、保険料を設定しています。
例えば、
- 事故が発生する確率が1%
- 事故が発生した場合の支払いが100万円
である場合、保険会社の平均支出(期待値)は次のようになります。
$$E(X) = 0.01 \times 100万 + 0.99 \times 0 = 1万円$$
この値を基に、保険料が決定されます。
マーケティング施策の効果予測への応用
期待値はマーケティングの効果測定や施策の意思決定にも活用できます。
例えば、ある企業が新しい広告キャンペーンを検討しているとします。過去のデータをもとに、広告を出稿した際の売上増加額の分布を分析し、各シナリオの発生確率を設定することで、キャンペーン全体の期待売上を計算できます。
例えば、過去の類似キャンペーンのデータから、次のような売上増加パターンが想定できるとします。
売上増加額 (万円) | 発生確率 (%) |
---|---|
50 | 20% |
100 | 40% |
150 | 30% |
200 | 10% |
この場合、期待値は以下のように計算されます。
$$(50 × 0.2) + (100 × 0.4) + (150 × 0.3) + (200 × 0.1) = 110$$
つまり、この広告キャンペーンを実施した場合、平均的には110万円の売上増加が見込めるということになります。
これを広告費用と比較することで、施策の実行可否を合理的に判断できるようになります。
このように、期待値はマーケティングの意思決定をデータドリブンに行うための重要な指標として活用できます。
まとめ
期待値は確率変数の平均的な値を示し、統計学や実社会で幅広く活用される重要な概念です。離散型と連続型で計算方法が異なりますが、本質的には「確率と値の積の合計」を求めるものです。
この考え方を理解すると、データの分析や予測がより直感的に行えるようになります。