数学に関するオモシロブログ マスログ

2016/07/10

あなたもやっている!? 「割合」でやっちゃうよくある誤解

田中さん(仮名・24歳)は某社のマーケティング部の一員。自分が担当している商品「らくらくクリーナー」の販売戦略を練るために、これまでの販売実績の統計を取っています。
 データの内容は、「らくらくクリーナー」を買った人の性別や年齢、職業、他にどんな商品を買っているか、などです。
 やがて田中さんは、面白いデータを手に入れました。
 なんと、「らくらくクリーナー」を買った人のうち、80%の人が別の商品「すきっとソープ」も買っていたのです。
 それならば、「らくらくクリーナー」と「すきっとソープ」を抱き合わせで売れば、もっと売れるのでは。そう思った田中さんは、早速上司に提案しました。
 ところが上司は、田中さんにこう言いました。
「こんなデータに意味はない。もう一度データを取り直せ」

 さて、妙な書き出しで始まりましたが、読者の皆さんは田中さんの何が間違っているか、お分かりになりましたか?
 田中さんの分析は、一見正しそうです。らくらくクリーナー(おそらく掃除用具でしょう)を買った人のうち80%もの人が、すきっとソープ(おそらく洗剤でしょう)も買っているのです。もしかしたら口コミで、「この2つを同時に使えば掃除がしやすくなる」と広まっているのかもしれません。なら、初めから抱き合わせで売った方が、お客さんが購入にかけるコスト(2つを探し回らないといけない労力)が少なくて済み、売り上げが伸びるかもしれません。
 それでも上司は、「こんなデータに意味はない」と一蹴してしまいました。もちろん、データそのものが間違っていたわけではありません。では、いったいなぜでしょう?

田中さんはリフト値を調べるべきだった

gf1420124918m

 結論から言ってしまいましょう。
 田中さんは、「らくらくクリーナーを買わなかった人が、どのくらいすきっとソープを買うか?」を調べなかったため、一蹴されたのです。
 つまり、らくらくクリーナーを買った人の80%がすきっとソープを買っていても、らくらくクリーナーを買わなかった人も80%がすきっとソープを買うのなら、らくらくクリーナーとすきっとソープの間には何の関係もないことになります。らくらくクリーナーを買おうが買うまいが、80%の人がすきっとソープを買うからですね。
 ビジネスの世界では、この考えを「リフト値」という言葉で表現します。

 リフト値とは何でしょうか?
 これは名前の通り、「ある事柄が起こったとき、別の事柄が起こる確率が高くなる(liftされる)かどうか」を表す数値です。
 ポイントは、「確率が高いかどうか」ではなく「高くなるかどうか」という点です。元々の確率に対して高くなっているときに、「リフト値が高い」と表現するのです。
 元々の確率とは何でしょう? これは田中さんの例で言えば、「らくらくクリーナーとは無関係に、すきっとソープを買う確率」です。
 すきっとソープのターゲット層が、例えば東京都渋谷区に住む40代の主婦だったとしましょう。すると元々の確率は、「東京都渋谷区に住む40代の主婦がすきっとソープを買う確率」となります。
 この確率は、まず東京都渋谷区に住む40代の主婦が何人いるのかを推計し、そのうち何人がすきっとソープを買ったかを調べれば、下の式で計算できます。

元々の確率

 もしこの値が80%よりも低ければ、らくらくクリーナーには「すきっとソープを買わせる効果がある」と考えられます。なぜなら、本来80%以下の確率で起こることを、80%の確率で起こすようになるからです。
 一方、元々の確率が80%くらいであったら、らくらくクリーナーとすきっとソープの間には、何の関係もないことになります。何もせずとも80%の人が買うのですから、らくらくクリーナーを買った人のうち80%がすきっとソープを買っていても、不思議でもなんでもありません。
 さらに、元々の確率が80%よりも高かったら……らくらくクリーナーには「すきっとソープを買わせなくなる効果」があると言えます。

 田中さんが犯した過ちは、らくらくクリーナーを買った人のデータだけを取ってしまったことです。田中さんは、らくらくクリーナーを買っていない人のデータも併せて取るべきだったのです。そして、両者のデータを比較するべきだったのです。

 ちなみに、リフト値を数式で表すと、次のようになります。

リフト値

 リフト値が1よりも大きければ、事柄Aが事柄Bを起こしやすくしていると考えられます。一方この値が1ならば、事柄Aと事柄Bの間には何ら関係がなく、この値が1よりも小さければ、事柄Aは事柄Bを起こしにくくしていると考えられます。
 リフト値を計算するときは、何が事柄Aで、何が事柄Bかをまず考えます。
 田中さんの例で言えば、事柄Aは「らくらくクリーナーを買う」で、事柄Bは「主婦がすきっとソープを買う」です。
従って分子は「らくらくクリーナーを買った主婦がすきっとソープも買う確率」となり、分母は「(らくらくクリーナーを買ったか買っていないかに関わらず)主婦がすきっとソープを買う確率」となります。分子を分母で割った値がリフト値で、田中さんはこれが1より大きいかどうかを調べるべきだったのです。

田中さんだけが悪いわけではない

 今回の件で、田中さんはデータの取り方を間違えました。しかし田中さんだけを責めるのは酷というものでしょう。
 なぜなら、世の中には同じような間違いがたくさんあるからです。

 例えば、よく「ゲームばかりしている子供は、学校の成績が下がる。だからゲームをさせてはいけない」なんて言いますね。でも読者の皆さんなら、この文言のどこがおかしいか、もうわかりますね? そう、これも本来は、リフト値を考えなくてはいけないのです。
 リフト値は、こんな式で計算できるのでした。

リフト値

 この文言では、事柄Aは「ゲームばかりする」、事柄Bは「成績が下がる」です。「ゲームばかりしている子の成績が下がる確率」を「成績が下がる確率」で割れば、リフト値が出ます。
 もしこのリフト値が1より高ければ、ゲームばかりする子は確かに成績が下がりやすいと言えます。しかしリフト値が1ならばゲームと成績の下降の間には何の関係もなく、1より低ければ、むしろゲームをした方が、成績が下がりにくいことになります。

 ほかにも、「アニメを見ていると凶悪犯罪を起こす」なんて言われたりしますが、これも本来はリフト値を考えなくてはいけません。つまり、事柄Aを「アニメを見る」、事柄Bを「凶悪犯罪を起こす」として、「アニメを見た人が凶悪犯罪を起こす確率」を「人が凶悪犯罪を起こす確率」で割った値が1より大きいかどうかで考えなくてはいけません。この値が1より大きかったとき初めて、「アニメを見ていると凶悪犯罪を起こす」と言えるのです。

 このような間違いは、なぜ起こるのでしょうか。
 それは人間が、何か興味深い現象を見つけたとき、その現象だけに注目してしまう癖があるからでしょう。そして、その現象に共通する特徴があったら、それが原因だと思い込んでしまうのです。
 しかし実際には、その現象が起こらなかった部分にも、注目する必要があります。起こった部分も起こらなかった部分も全部ひっくるめて調べた上で、「では起こった部分だけにある特徴は何か?」を考えなくてはいけないのです。

田中さんと同じ失敗をしないために

gf1420716165m

 まとめましょう。
 ある事柄Aによって、別の事柄Bが起こりやすくなっているかどうかは、リフト値を調べるとわかります。
 リフト値とは、「ある事柄Aが起こったとき、別の事柄Bが起こる確率」を「事柄Bが起こる確率」で割ったものです。つまり、事柄Bの起こる確率が事柄Aによって高くなっている(liftされている)かどうかを測る値です。リフト値が1より大きければ、BはAによって確率が高くなっています。一方、リフト値が1なら、AとBには何の関係もありません。
 皆さんもこれからは、「Aが起こったときBが起こるのだな」と感じた時は、少し立ち止まって、「そもそもAが起こらなかったとき、Bはどのくらい起こるのだろう?」と考えるようにしてみましょう。そうすれば、田中さんと同じ間違いは、犯さなくなるはずです。

(文/キグロ)