大数の法則とは何か?その具体例と、少数の法則との違いを解説

2023年4月13日

大数の法則とは

大数(たいすう)の法則(Law of Large Numbers)とは、サンプルサイズが大きければ大きいほどその平均は母集団全体の平均に近づくという確率論です。
厳密には、大数の法則は「大数の弱法則(Weak Law of Large Numbers)」「大数の強法則(Strong Law of Large Numbers)」に大別されます。
両者の違いはサンプルサイズが十分に大きい際の母平均への収束方法です。
大数の弱法則は、標本平均と母平均との誤差が一定の値から大きく外れる確率が限りなく0に近いとするものです。
一方、大数の強法則は標本平均と母平均とが一致する確率がほぼ必ず1に近づくとしています。

大数の法則の具体例

大数の法則を考える上で例に挙げられるのが、表と裏が同じ確率で出るコインを使ったコイントスです。
表が出る確率が2分の1のコインをn回投げるとします。
nが小さい(投げる回数が少ない)うちは実際に表が出た割合は2分の1にならないことがあります。
例えば10回中2回表が出た、すなわち表が出た割合が5分の1になる場合などです。
しかし、nが大きくなればなる(投げる回数が多くなる)ほど、表が出た割合は2分の1に近づいていきます。

大数の法則の活用事例

大数の法則を用いるとシミュレーションによって全体を推測できるようになります。
このメリットは次のような場面で活かされています。

生命保険・損害保険

保険料の算出のためには、事故の発生率が必要です。
保険会社では事故の発生率を予測するのに大数の法則を用いています。
事故は個々の当事者の立場から見ると偶発的なものであり予測はできません。
しかし、集団全体として観察すると事故当事者は特定できないものの、集団としての事故発生率を予測できるようになります。そこから導き出した集団としての保険金額や事故の発生件数を元にして、保険会社は保険料を算出しています。

標本調査

母集団全体の平均をより正確に推測したい場合はサンプルサイズを大きくすればよいということが大数の法則から導かれます。
この考えを元にして実施されているのが標本調査(サンプリング調査)です。
ビジネスにおいては市場調査として顧客満足度や認知度、ニーズの調査などに用いられています。
マーケティングリサーチを実施する際、すべての対象者にアンケートすることは現実的ではありません。
そこで適切なサンプルサイズを計算して一部の対象者を調査することで全体の対象者について推測します。

品質管理

製造業でも品質管理において大数の法則を適用しています。
製品に不具合が生じた時にデータ数が少なければ、たまたま品質の悪い製品だったのかそれとも生産工程に問題があって不具合が生じているのか判断できません。
そこでデータを多く取得することで不具合の発生率を計算します。
不具合がどの工程でどのくらい発生しているのか把握することは、生産工程の見直しにもつながります。

関連する定理・法則との違い

大数の法則に関連した用語として「中心極限定理」と「少数の法則」があります。

中心極限定理

大数の法則同様、確率論の重要な定理として知られているものに「中心極限定理(Central Limit Theorem)」があります。
中心極限定理は標本平均が母平均に近づくという大数の法則を元にして、標本平均と母平均の誤差がどのような分布に従うのかを示した定理です。
サンプル数を十分に大きくしていくと正規分布に従います。

少数の法則

「少数の法則(Law of Small Numbers)」とは、少ないサンプル数から得られた情報には偏りがあるにもかかわらず、過大評価して一般化してしまうことです。
1971年にノーベル賞経済学者のダニエル・カーネマン(Daniel Kahneman)が提唱したとされる法則で、大数の法則に由来して名づけられています。
少数の法則の例としてコイントスを考えると、数回続けて表が出た時に「このコインは表が出やすいコインだ」と認識することだといえます。

参考

  • https://best-biostatistics.com/hypo_test/taisuu.html(2023年4月4日確認)
  • https://utann.hatenablog.com/entry/2020/12/21/095909(2023年4月4日確認)
  • https://www.sompo-ri.co.jp/wp-content/themes/sompori/assets/pdf/asia2018_07.pdf(2023年4月4日確認)