バークソンのパラドックス、シンプソンのパラドックスとは何か?『因果推論の科学 「なぜ?」の問いにどう答えるか』の内容を中心に解説
膨大なデータを解釈する際、直感に反した結果が出てしまうパラドックスが発生することがあります。
これらのパラドックスの存在に気がつかないまま議論を進めると、誤った(あるいは正反対の)結論を導き出してしまうため、注意が必要です。
本記事では、因果推論の場面でよく登場するバークソンのパラドックスとシンプソンのパラドックスについて解説します。
バークソンのパラドックス
バークソンのパラドックスの概要
バークソンのパラドックス(Berkson’s paradox)とは、1946年に生物統計学者のジョセフ・バークソンによって提唱されました。
本来関係がないはずの2つの要因が、交絡因子影響によって統計的に関係性があるかのように見えてしまうパラドックスです。
バークソンのパラドックスの事例
バークソンのパラドックスは、観測データの偏りや選択バイアスによって生じます。
バークソンのパラドックスの実例をご紹介します。
事例1:結核は癌を予防する?
結核患者と癌患者が入院する病院があると仮定します。
この病院の中で癌と結核の発症の関連性について分析を行いました。
すると統計的に「結核患者は癌になりにくい」という傾向があることがわかりました。
しかし、現代の医学において結核と癌にそのような関係性は認められていません。
なぜ入院患者の分析結果から無関係のはずの疾病が関連しているかのような結論が出たのでしょうか。
これが、バークソン氏が最初に指摘したバークソンのパラドックスの類例です。
事例2:イケメンは性格が悪い?
「外見が魅力的な人ほどデートすると人柄が悪いと感じるのはなぜでしょうか」
この問いはジョーダン・エレンバーグの著書『データを正しく見るための数学的思考』で述べられた、バークソンのパラドックスの説明で用いられる問いです。
大前提として容姿と性格には全く関係がありません。
しかし、多くの女性が「外見が魅力的な人ほど人柄が悪い」と感じているという事例があります。
なぜこのような事実とは異なる印象を受けるのでしょうか。
バークソンのパラドックスが起こる原因
選択バイアス
バークソンのパラドックスは、選択バイアスによって起こります。
選択バイアスとは、実験参加者を集める方法や実験の方法などによって偏ったサンプルデータが収集されてしまうというバイアスです。
ここからは、事例1と事例2のバークソンのパラドックスがなぜ発生したのかを、選択バイアスで解説していきます。
事例1の場合
事例1の癌と結核の例では「調査対象が病院内」という選択バイアスがかかっています。事例1では、結核患者と癌患者が入院する病院で調査を行っています。
これにより、「癌でも結核でもない人」という全体の大多数の人がデータから除外されたデータセットが作られてしまいました。
「結核患者は癌になりにくい」かどうかは、結核患者でない人のデータも必要ですが、事例1では収集されていません。
また、「癌であり、結核も患っている人」というのは事例としては多くはないことが想定できます。
それらの要因が組み合わさることで、事例1でみられた「結核を患っている人は癌になりにくい」という誤った結論が導かれてしまいます。
事例2の場合
事例2の容姿と性格の関連性も、同じように選択バイアスからくるバークソンのパラドックスです。
ここでは、女性が男性を見る時に「デートしたいと思う人」かどうかという選択バイアスがかかっています。
全男性の中で、「人柄はとても良いが外見は好みではない人」はデータから除外されてしまっているのです。
結果的に全男性の中から恣意的に選ばれた男性の容姿と人柄が、擬似的に相関しているように見えているということになります。
事例1と同様、事例2の「外見が魅力的な人ほど人柄が悪い」という結論も、「外見が魅力的でない人」と接した上で判断しなければならないのですが、「外見が魅力的な人」のデータだけが集まった結果、誤った結論が導かれてしまいます。
以上のように、選択バイアスによって偏ったデータセットを作り出してしまい、本来関係性がないはずの事象同士を結びつけてしまうのがバークソンのパラドックスの正体です。
バークソンのパラドックスに陥らないためには、選択バイアスを意識して実験デザインを行うことが重要です。
シンプソンのパラドックス
シンプソンのパラドックスの概要
シンプソンのパラドックス(Simpson’s paradox)は、1951年に統計学者のエドワード・シンプソンによって提唱されました。
とある集団において正の相関が成立したとしても、母集団全体では負の相関に逆転する場合があるというパラドックスです。
シンプソンのパラドックスの事例
シンプソンのパラドックスは、集団ごとのサンプルサイズの差によって発生します。
シンプソンのパラドックスの事例をご紹介します。
事例1:就職率が高いのはどっち?
とある2つの大学の就職率を比較します。
理系 | 文系 | 全学生 | |
A大学 | 90% (900人/1000人) | 65%(130人/200人) | 85%(1030人/1200人) |
B大学 | 95%(380人/400人) | 70%(560人/800人) | 78%(940人/1200人) |
理系と文系どちらにおいてもB大学の方が就職率が高いことがわかります。
しかし、学生全体で見た時の就職率はA大学の方が高くなります。
データを見る範囲、つまり理系/文系それぞれで比較するのか、全体で比較するのかによって、就職率に対する結論が正反対になってしまいます。
事例2:ワクチン接種の効果は?
近年、感染症のワクチンの効果についても様々な議論が行われています。
ニュースなどで「感染症重症患者の6割がワクチン接種済みであった」という、ワクチンの効果に疑いを持ちたくなるようなデータが示されたとします。
この例はまさにシンプソンのパラドックスが起きているといえます。
仮に、ワクチン接種率と重症者率が以下だったとします。
全体(100人と仮定) | 重症者(10人と仮定) | |
接種済 | 80%(80人) | 60%(6人) |
未接種 | 20%(20人) | 40% (4人) |
確かに「感染症重症患者の6割がワクチン接種済みであった」というのは正しい情報なのですが、全体における接種済みの人の割合についても考慮する必要があります。
全体のワクチン接種割合を考慮して計算すると、ワクチン接種済みの重症化率が7.5%なのに対し、ワクチン未接種における重症化率は20%になります。
シンプソンのパラドックスが起こる原因
シンプソンのパラドックスは、比較対象のサンプルサイズに差があることで発生します。
事例1の就職率の例では、A大学の文理の人数比に極端な差があります。
これが原因で、A大学の文系/理系それぞれの就職割合としてはB大学より低いものの、実際の就職人数はB大学より多くなりました。
事例2のワクチン接種の効果の例では、全体におけるワクチン接種済みと未接種の母数が大きく異なる中で、重症者患者のワクチン接種の有無を比較しています。
それにより一見するとワクチン接種患者の方が重症化しやすいのではないかという錯誤を生んでしまいました。
このように前提に偏りがある状態で比較を行うと、事実とは異なる印象を受ける結果を導いてしまうことがあります。
これが、シンプソンのパラドックスです。
そもそもの母集団の構成上、偏りのないデータを収集するのが難しいケースがほとんどです。
シンプソンのパラドックスに惑わされないためには、まずはこのパラドックスの存在を認知しましょう。
結論づける前に検証を行うことで、誤った結論付けを防ぐことができます。
参考
書籍
- ジューディア・パール(著)、ダナ・マッケンジー(著)、夏目大(訳)『因果推論の科学 「なぜ?」の問いにどう答えるか』文藝春秋、2022年
Webページ
- https://brilliant.org/wiki/berksons-paradox/(2023年5月2日確認)
- https://gigazine.net/news/20210325-berkson-paradox/(2023年5月2日確認)
- https://www.statisticshowto.com/berksons-paradox-definition/(2023年5月2日確認)
- https://www.jstage.jst.go.jp/article/jjaam/20/9/20_9_794/_pdf(2023年5月2日確認)
- https://x-tech.pasona.co.jp/media/detail.html?p=8170(2023年5月2日確認)