ベイズ統計とは？分かりやすくまとめ

ベイズ統計とは、不確実性を確率によって表し、得られるデータや新しい情報を取り入れながら、その確率を更新していく手法の総称です。

名前の由来は、18世紀のイギリスの数学者・牧師であるトーマス・ベイズ（Thomas Bayes）による「ベイズの定理」と呼ばれる方程式に基づいていることから来ています。

Contents

ベイズの定理

ベイズの定理は、以下の式で表されます。

$$P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}$$

この式が表していることを例を使って見てみます。

ある病気を持っている人の割合（有病率）が 1% であるとします。

ある検査を受けると、病気を持っている人は 99% の確率で陽性となり（真陽性率）、病気を持っていない人は 95% の確率で陰性になる（特異度が 95% なので、陽性に間違ってなるのは 5%）としましょう。

検査が陽性だったとき、本当に病気である確率はどのくらいでしょうか？

これがまさに $P(\text{病気} \mid \text{陽性})$ を求める問題で、ベイズの定理で計算できます。

まず、$P(\text{陽性})$（周辺確率）を求めます。

病気を持っている人が陽性となる確率
$P(\text{陽性} \mid \text{病気}) \times P(\text{病気}) = 0.99 \times 0.01 = 0.0099$
病気を持っていない人が陽性となる確率
$P(\text{陽性} \mid \text{健康}) \times P(\text{健康}) = 0.05 \times 0.99 = 0.0495$

よって、

$$P(\text{陽性}) = 0.0099 + 0.0495 = 0.0594$$

となります。

次に、ベイズの定理を使って、$P(\text{病気} \mid \text{陽性})$ を計算します。

$$P(\text{病気} \mid \text{陽性}) = \frac{P(\text{陽性} \mid \text{病気}) \times P(\text{病気})}{P(\text{陽性})} = \frac{0.0099}{0.0594} \approx 0.1667$$

つまり、検査が陽性だった場合でも、実際に病気である確率は約 16.7% に過ぎない、ということが分かります。

この例から分かるように、「陽性だったらほとんど病気だろう」と思いがちですが、病気の事前確率が低い場合には、検査の精度がある程度高くても実際には病気でない確率も大きくなることがあります。

このようにベイズ統計では、新しい情報（検査結果など）を加味して、“もともと考えていた確率（事前確率）” を “更新” し、最終的な “事後確率” を得ることが特徴です。

新しい情報が得られるたびに確率を更新できる
ベイズの枠組みでは、新しいデータが観測されるたびに、現在持っている “事前確率” を、より信頼度の高い “事後確率” へ更新できます。こうした考え方は、リアルタイムや逐次的にデータが得られるような場面で特に有用です。
不確実性を自然に扱える
点推定（「平均はこうです」というような一点の推定値）だけではなく、確率分布として結果を示すので、どのくらいの不確実性や幅があるのかを定量的に把握しやすくなります。
主観的な事前知識（事前分布）を反映できる
既存の研究や専門家の知見を「事前分布」として導入することで、まったくデータが少ない場合や、実験を始めたばかりの段階でも、ある程度の推定や推論ができるようになります。

マーケティング
広告施策やキャンペーンの効果測定において、A/B テストの結果をベイズ的に更新することで、最も効果的な施策を探索する。
医療・臨床試験
新しい薬の治験において、既存の薬や過去の研究結果を事前分布として取り入れることで、少ない被験者データでもより信頼性の高い推定を行う。
機械学習
ベイズ回帰やガウス過程など、ベイズの考え方を応用したモデルが多く活用されている。ニューラルネットにもベイズ的な解釈を付与するアプローチ（ベイズニューラルネットワーク）もあります。
ロボティクス
センサーが捉える環境情報にはノイズが多いですが、ベイズフィルタ（カルマンフィルタや粒子フィルタなど）の考え方によって、移動体の位置推定や物体認識の精度を高める。

事前分布の設定
- 自分が持っている知識や仮説、過去のデータをもとに、未知パラメータに対する「事前分布」を設定する。
データ（尤度）の観測
- 実験や観測から得られたデータを、モデルに合わせて「尤度関数」として定式化する。
事後分布の計算
- ベイズの定理を用いて、事前分布とデータの尤度から事後分布を求める。
- 実際には解析的に解けない場合が多いので、MCMC（Markov Chain Monte Carlo）などの数値的な手法を用いることが多い。
推定・予測・意思決定
- 得られた事後分布からパラメータの推定値を取り出したり、将来のデータを予測したりする。
- 事後分布の幅から不確実性を推定し、それを踏まえて意思決定を行うことが可能。