因果推論とは何か?『因果推論の科学 「なぜ?」の問いにどう答えるか』の内容を中心に、因果推論について解説

2023年5月12日

ビジネスではさまざまな場面で意思決定を求められます。
近年では機械学習やビッグデータの進歩により、データに基づいた意思決定を行いたいと考える企業は多くなっています。

因果推論は、プロモーションなどの企業活動と結果を評価することができるため、ビジネスの現場で活用されています。

今回は『因果推論の科学 「なぜ?」の問いにどう答えるか』の内容を中心に、因果推論について解説していきます。

因果推論とは?

因果推論にも含まれている「因果」とは、「Aという結果はBという原因によって成り立つ」ことを指します。
そして、因果推論は、手元にあるデータから統計的に因果を取り出す考え方で、機械学習の世界では「統計的因果推論」とも呼ばれます。

因果関係と相関関係の違い

因果関係と同一視されがちな考え方として「相関関係」があります。

相関関係とは「事象Aと事象Bが関係していること」を指します。
因果関係と相関関係の具体的な違いは、関係の方向性です。

因果関係は事象Aと事象Bの関係性は「事象Aによって事象Bが引き起こされる」という一方通行であるのに対し、相関関係は「事象Aが高くなるとき事象Bも高くなる」という双方向の関係が成立します。

相関関係の例

たとえば、ある学校の英語の先生が、生徒のテストのデータを集めた結果、「英語のテストの点数が高い人は、数学のテストの点数も高い」ということを発見したとします。
しかし、「英語テストの点数が高い人ほど数学テストの点数が高い」というのは、どちらかが原因になって引き起こされている事象ではありません。
つまり、「英語の点数が高いから、数学の点数も高い」のか、それとも「数学のテストの点数が高いから、英語のテストの点数も高い」のか、判断することができません。
どちらが原因になっているのかわかりませんし、別の要因が原因になっている可能性もあります。
そのため「数学テストの点数が高い人ほど英語テストの点数が高い」と言い換えても、意味が変わることはありません。これが相関関係です。

因果関係の例

一方で、「気温が高いほどアイスクリームが売れる」は因果関係です。
「アイスクリームが売れるほど気温が高くなる」ということはないので、原因と結果の方向性が一方通行になっているためです。

因果関係は、相関関係の中の1つの状態なので、全くの別物ということではありません。

しかし、単に相関関係があるだけの事象に対して因果を意味づけしてしまうと、間違った方向性に議論が進んでしまうので注意が必要です。

因果推論の手法

因果推論を行う際の基本的な手法を解説します。

ランダム化比較試験(randomized controlled trial: RCT)

被験者を2つ以上のグループにランダムに分け、介入の効果を検証します。
この試験はA/Bテストとも言われます。

この試験では、被験者をランダムに分けることでそれぞれのグループに割り振られた人々の特徴が平均化されていることが前提となります。

介入以外の他の特徴が平均化されていることで、介入群と非介入群の間で差分が出た場合に、介入の効果を測ることができるという考え方です。

デメリットとしては、被験者の数が少ないと群が平均化されずに正しい評価ができなくなってしまうこと、試験コストが高いことが挙げられます。

差分の差分法(Difference in differences: DID)

差分の差分法は、「介入データの介入前後」「非介入群の同タイミングのデータ」を比較します。

例として、地域Aに対して交通事故防止のPR活動を行った場合を考えます。
まず、地域Aのみに介入(PR活動)を行い、介入前後の交通事故の傾向差を比較します。
この時、非介入群である地域Bの同タイミングのデータを収集し、介入がなかった場合にはどのような傾向であったかを調査します。

「地域Aの介入前後の差分」と、「地域Aと地域Bの差分」、2つの差分を比較するので、「差分の差分法」と呼ばれています。

注意すべき点は、非介入群のデータが必要になることです。上記の例でいえば、介入前の地域Aのデータや、同期間の地域Bのデータを取得しておかなければ、差分の差分法を使うことができません。

実験を行う際には介入群のデータしか収取されていないケースが多いため、差分の差分法による効果検証を行う際には事前に実験計画を立てて、非介入群の検証データを集めておく必要があります。

回帰不連続デザイン(Regression Discontinuity Design: RDD)

回帰不連続デザインは、介入群と非介入群が人為的なルールで分かれているときに利用される手法です。

例としては、アルコールの身体への影響を調べる際、20歳未満と20歳以上でアルコールの摂取有無が分かれている場合などです。

このように特定の閾値やルールによって介入がなされている場合は、介入群と非介入群の特徴が平準化されません。そういった場合に、回帰不連続デザインによる因果推論を行います。

回帰不連続デザインでは、閾値前後の観測者は似た傾向を持っていることを仮定します。
アルコールの摂取を介入として考えると、非介入群の18、19歳と介入群の20、21歳はアルコール摂取以外に身体的に大きな差がないという前提をとります

そして20歳前後の対象を分析することで、アルコールという介入の効果を検証します。

デメリットとしては、前述したように閾値前後の観測値はほぼ同じ属性であることを前提とするため、この条件が満たされない場合は使用できません。
たとえば18、19歳の群に女性が多く、20、21歳の群に男性が多いなど、介入以外の偏りがある場合には正しい効果検証ができなくなってしまいます。

因果関係を調べるのは難しい

因果推論の手法は発展を続けていますが、基本的には因果関係を解き明かすのは難しいとされています。
その原因の1つが検証の過程でさまざまなバイアスがかかりやすいという点です。

因果推論を行う過程で起きやすいバイアスをご紹介します。

選択バイアス

選択バイアスとは、「手に入ったデータ」で分析を行う際に、「手に入らなかったデータ」が分析されないことによって起こるバイアスです。

たとえばAさんにクーポンメールを配信して、Aさんが10,000円分の買い物をした時、クーポンメールの効果はどの程度だったのでしょうか。
その比較のためには、同時期に全く同じ状況でAさんにクーポンメールを配信しなかった結果の購買量と比較する必要があります。

しかし、同一サンプルからはどちらか一方の結果を観測するため、本当にクーポンメールの効果があったかどうかの検証を行うことができません。

このような選択バイアスを避けるために、A/Bテストや反実仮想という手法が用いられています。

サンプリングバイアス

調査をする際に、調査対象を特定の学校の学生や、類似の特徴を持つグループから集めることで、統計調査の結果が一般人に適用できないことをサンプリングバイアスと言います。

本来であればサンプリングは被験者の特徴が平均化されるよう、ランダムに行うのが良いとされています。
しかし現実的に考えると、国勢調査のような大規模な施策を打たない限りは全ての対象からランダムに調査対象を集めることは困難です。

データ収集の実現性の背景から、統計調査ではサンプリングバイアスが起きやすいとされています。

志願者バイアス

被験者を選ぶ際に、志願者を募ることで「この実験に興味がある人」という志願者バイアスがかかります。
健康調査アンケートに回答する人は、もともと健康意識が高い人である可能性が高く、アンケートの結果が一般的な結論より偏ってしまうなどです。

疑似相関と交絡因子

交絡因子とは、事象Aと事象Bに共通している因子を指します。
例としては、地域における薬局と映画館の数に相関関係があることが挙げられます。

薬局の多い地域は映画館も多いという正の相関が認められますが、これらが直接的に関係していないことは明らかです。

しかし、薬局と映画館はそれぞれその地域の「人口」という因子に強く影響を受けています。
つまり、「人口が多いほど薬局が多い」、「人口が多いほど映画館が多い」という関係性があるため、結果的に、薬局が多い地域は映画館が多いという相関関係が成立します

これを疑似相関と言い、人口は交絡因子に当たります。

薬局と映画館のように、明らかに関係性の遠い要素に相関が見られた場合は疑似相関を疑うことができますが、実際の問題では交絡因子はより複雑に絡み合っています。

結論を出す際には、疑似相関を疑って検証を行う必要があります。

参考

書籍

  • ジューディア・パール(著)、ダナ・マッケンジー(著)、夏目大(訳)『因果推論の科学 「なぜ?」の問いにどう答えるか』文藝春秋、2022年
  • 斎藤優太、安井翔太『施策デザインのための機械学習入門~データ分析技術のビジネス活用における正しい考え方』株式会社技術評論社

Webページ

  • https://www.tdse.jp/blog/tech/6951/(2023年4月17日確認)
  • http://yukiyanai.github.io/jp/classes/econometrics2/contents/slides/metrics2_topic08_slides_pub.pdf(2023年4月17日確認)