中心極限定理は、統計学において非常に重要な法則であり、ある条件下で「標本平均の分布が正規分布に近づく」ことを示しています。
この法則により、母集団(全体のデータ集合)の分布がどのような形であっても、標本数が十分に多ければ、標本の平均値が正規分布に従うようになります。
例えば、偏りのある母集団でも、たくさんのサンプルを取ってその平均を計算すると、平均値は正規分布に近づくという特性です。
この性質により、正規分布の特性を利用して、母集団の未知の平均や分布を推測することができ、データ分析の基礎となっています。
中心極限定理は、仮説検定、信頼区間の計算、平均値の推定など、さまざまな場面で活用されています。
中心極限定理の数学的な定義
母集団の分布にかかわらず、母平均が μ、標準偏差が σ である母集団から、サイズ n の標本を何度も抽出し、それぞれの標本平均を計算します。
これによって、標本平均の分布が以下の性質を持つことが示されます。
- 標本平均の期待値(平均の平均)
複数の標本平均の平均値(理論上の期待値)は、母集団の平均 μ に等しくなります。
すなわち、標本平均は母平均の推定に役立つ指標となります。 - 標本平均の標準偏差(標準誤差)
標本平均の分布のばらつきは、母集団の標準偏差 σ を標本サイズ n の平方根で割ったもの(σ/√n)に近づきます。この「標準誤差」により、標本サイズを増やすことで平均値の推定精度を上げることができます。 - 標本平均の分布
標本数 n が大きくなるにつれて、標本平均の分布は正規分布 N(μ, σ²/n) に近づきます。この性質を利用することで、さまざまな統計的な手法で「標本データを用いた母集団の推定」が可能になります。
中心極限定理の意義
中心極限定理は、統計的な推測を行う上で重要な役割を果たしています。
たとえば、以下のようなメリットがあります。
- 母集団の分布が不明でも標本から推測が可能
母集団が正規分布でなくても、標本数が十分であれば正規分布に基づいた推測ができるため、実務的なデータ分析においても非常に有効です。 - 標本平均の分布を正規分布とみなして推測が可能
平均や標準偏差の推定、信頼区間の設定、仮説検定などで、中心極限定理が基盤となっています。これにより、サンプルデータから母集団の性質を推測しやすくなります。
マーケティングにおける中心極限定理の応用例
中心極限定理は、マーケティングの各種調査やパフォーマンス測定でも応用されています。
顧客満足度調査
顧客満足度調査では、すべての顧客からのデータ収集が難しいため、調査対象の一部をランダムに抽出し、その平均満足度をもとに母集団全体の満足度を推定します。
ここで中心極限定理が適用され、サンプル数が十分に多ければ標本平均の分布は正規分布に近づきます。
そのため、サンプルの満足度平均を母集団全体の平均の推定に用い、信頼区間を設定して、推定結果に対する精度を評価できます。
A/Bテストの解析
マーケティングキャンペーンやウェブサイトのA/Bテストで、異なる施策の効果を比較する際にも、中心極限定理が適用されます。
例えば、ある商品の購入率を A グループと B グループで比較する場合、それぞれのグループの平均購入率が母集団の購入率をどれほど反映しているかを推測するために中心極限定理を使用します。
サンプルサイズが大きいほど、標本平均が母集団平均に近づくため、施策の違いによる効果を正確に検証できます。
まとめ
中心極限定理は、データがどのような分布を持っていても、標本数が十分に大きければ標本平均の分布が正規分布に近づくことを示しており、さまざまな分野で利用されています。中心極限定理を利用することで、母集団全体の傾向をより精度高く推定することが可能になります。