マスログ

2020/02/28

書籍紹介「因果関係と相関関係の違い」がしっかり書かれた因果推論の入門書

WAKARAの数学&統計講師の川原祐哉です。

いつも新橋教室をメインとして個別授業を行っておりますが、土地柄なのかビジネスに統計を活用されるお客様が多い気がしています。
そこで、最近特に統計授業の中でも質問や取り扱いが多い相関因果に関する書籍を紹介したいと思います。

【「原因と結果」の経済学―データから真実を見抜く思考法】 中室 牧子、津川 友介 著 ダイヤモンド社

本書籍は「因果推論の入門書」として有名な本で、数学を使わないで因果推論とは何かを解説してくれている本です。弊社、数学教室でもこれから統計学を始めてみようという方に、よくお勧めしています。

内容としては、世の中には下記のような相関データはたくさん存在します。
・子供にテレビを見せると学力は下がる。
・偏差値の高い大学へ行くと収入は増える。

しかし、その相関を因果関係と言ってしまっても良いのでしょうか?
因果関係相関関係は別物だということを具体例を通じ、かつ難しい数式を用いずに説明することに成功しています。

紹介されている手法は、RCT差分の差分法操作変数法回帰不連続デザイン傾向スコアマッチングなど、計量経済学、医療分野で実際に使われているものをとりあげています。
統計ツールを使って、実際に分析することはカバーしていませんが、因果推論の学習を始める入門書として最適です。

因果関係とは?

因果関係というと難しく思われるかもしれませんが、一般的に、「〇〇すると▼▼が起こる」というような原因と結果の関係という意味で使われています。
実はこれを数学的に定式化して議論することはとても大変です。

例えば「勉強すると学力が上がる」という例を考えてみたいと思います。
まず「勉強すると学力が上がる」という因果関係を議論するには、

(1) 子供たちが1日にどれくらい勉強したかというデータ

(2) その子たちがどれくらいの学力があるか

という2つのデータが必要になります。

仮にこのデータが取得できたとして、2つのデータ間に次のような関係があったとしましょう。

これだけをみると、勉強をした子は学力が上がる!因果関係がある!と言ってしまいそうですが、実はこの2つのデータの関係性は因果関係とは言わず、相関関係と言います。

相関関係」とは2つのデータが連動性を表す言葉です。もう少しかみ砕いて言うと、片方のデータの値が上がると、もう片方のデータの値も上がる(もしくは下がる)傾向にあるときに、2つのデータは相関しているといいます。
上の勉強と学力のデータで言うと、勉強時間が多い子は学力も高い傾向にあると言えそうなので、勉強と学力の間には相関があると言えそうです。しかし、相関関係があると言えても、因果関係がある、つまり片方はもう片方の原因となっている、とまでは言うことが出来ません。

なぜこの2つの関係を区別するのでしょうか。
実は世の中のデータには連動していても、つまり相関関係があっても因果関係がない現象がたくさんあるのです。

上の例の場合を例にこの現象を考えてみましょう。
ここで新しいデータ、両親の学力というデータを考えてみます。両親の学力が高いほど、自身の子供に勉強をさせるということが考えられます。また両親の学力が高いほど自然と自身の子供の学力は高くなることが考えられます。そうすると、勉強と学力の間には直接的な因果関係がなくても、両親の学力というもののせいで、勉強と学力が連動してしまうことになります。

2つのデータ(勉強と学力)の両方に影響を与える第3の変数を「交絡因子」といい、この交絡因子があるせいで2つのデータが連動してしまう現象を「交絡」といいます。

これからわかるように、勉強と学力の間に相関関係が得られたとしてもそれは本当に勉強から学力への因果関係があるのか、それとも、勉強と学力の間には因果はないが交絡が起きていて相関が見られるのかが、勉強と学力のデータからでは判断がつかないのです。

そこでこの交絡という現象を取り除くためにいろいろな方法が開発されてきました。それらの一部が本書で紹介されているRCT差分の差分法操作変数法回帰不連続デザイン傾向スコアマッチングなどです。

これら分析手法の名前は難しいですが、やろうとしていることはどれも同じで交絡という現象を取り除こうとする手法です。どれも数学的に厳密に見ていくには数式が必要にはなりますが、本書では数式を使わずに”考え方を理解させる”という形で書かれており、数学が苦手な方でも問題なく読むことができます。これからデータ分析にチャレンジしてみようという方はこの本から因果推論の考え方を学ぶのが最適でしょう。

また、和から株式会社では因果推論のセミナーも行っております。因果推論の世界をのぞいてみたいという方も、ビジネス等で効果測定などに使っていきたいという方も、よければぜひご参加してみてください。いずれもオンラインでの受講可能です。

■因果推論って何?これから学んでいきたい!という方向け

原因と結果の思考法超入門 -データ関連性を正しく把握する- 因果推論とは何か、因果推論が社会で必要な理由など、今後データ分析の発展とともに進化していく因果推論の基本的な考え方や日常データの正しく読み取るための考え方など、基礎から解説します。

■実際に因果推論、分析を行っていきたい!という方向け

原因と結果の思考法入門 -層別解析編- 本セミナーでは、因果推論の考え方はもちろん、その分析を実際に行っていくことを目的としたセミナーです。分析ツールとしてエクセルを使用し、実際にデータを分析していく方法を学びます。難しい数式は使いませんので、初めての方でもご安心してご受講いただけます。

<文/川原祐哉>
⇒ 講師紹介ページへ

「数学教室和(なごみ)」では個別授業で学びたい数学・統計を全力サポートいたします。お問い合わせはこちらから。お問い合わせページへ

カテゴリー

記事一覧

Instagram

Facebook

Twitter