データの関係を読み解こう-第2回:“関係の強さ”を数字で確かめる【統計学をやさしく解説】
公開日
2025年11月3日
更新日
2025年10月29日
この記事の主な内容
はじめに:見た目の関係を“数字”で表そう
前回の第1回では、散布図を使って「2つのデータの関係を目で見る」方法を紹介しました。今回は、見た目ではわかりにくい「関係の強さ」を相関係数(そうかんけいすう)という数値で表す方法を学びます。
数字で関係を測ることができると、「どの要素が結果に影響しているか」をより正確に把握できるようになります。ビジネスでも、売上と広告費、顧客満足度とリピート率など、さまざまな分析で役立つ基本です。
相関とは?
相関とは、2つのデータが「どの程度一緒に変化しているか」を示す関係のことです。
・片方が増えるともう片方も増える → 正の相関
・片方が増えるともう片方が減る → 負の相関
・変化に関係がない → 無相関
この「関係の強さ」を数値で表すのが相関係数(correlation coefficient)です。値は−1から+1の範囲で、次のように読み取ります。
| 相関係数rの値 | 意味 | 関係のイメージ |
|---|---|---|
| +1に近い | 強い正の相関 | 広告費↑ → 売上↑ |
| 0に近い | 関係がほとんどない | 社員数と平均気温 |
| −1に近い | 強い負の相関 | 価格↑ → 購買数↓ |
広告費(万円)
図1:r=0.95の強い正の相関
相関係数の求め方(Excelで簡単)
Excelでは、関数を使って相関係数を簡単に求められます。
例)広告費(A2:A10)と売上(B2:B10)の相関を調べたい場合:
=CORREL(A2:A10, B2:B10)
結果が「0.89」と出た場合、強い正の相関があるといえます。つまり、広告費が増えると売上も増える傾向が強いということです。
注意!「相関=因果」ではない
ここで重要なのが、「相関があるからといって、原因と結果があるとは限らない」という点です。
有名な例がこちら:
・氷の売上と日焼け止めの売上には強い正の相関がある。
・しかし、どちらも「気温」という第三の要因で動いている。
気温 ↑ ⇒ 氷の売上 ↑ / 日焼け止め ↑
→ 氷と日焼け止めの間には見せかけの関係(擬似相関)がある
このように、相関があっても「片方がもう片方を引き起こしている」とは限りません。データを見るときは、第三の要因(背景要因)にも目を向けましょう。
ビジネスでの活用例
・マーケティング分析:広告費と売上の関係を、感覚ではなく数字で確認できる。たとえば「広告費を1万円増やすと売上がどの程度上がる傾向にあるか」を相関係数で客観的に把握できます。これにより、広告の効率性や投資配分を見直す判断がしやすくなります。
・人事分析:残業時間と離職率の関係を見る。実際のデータを使って「働きすぎが離職につながっていないか」を数値で評価できるため、職場環境改善の根拠づけにも役立ちます。
・顧客分析:顧客満足度とリピート率の関係を測定する。アンケート結果や購買データを組み合わせて、「満足度が高い顧客ほど再購入しているのか」を定量的に分析できます。
・営業活動:訪問回数と契約率の相関を見ることで、「どのくらい接触すると成果が出やすいか」を見極められます。
・教育・研修:受講時間とスキルテスト結果の相関を調べると、学習効果の高いプログラムを見つける手がかりになります。
相関を使えば、「どの要素が成果に関係しているのか」「改善の余地があるのはどこか」をデータで示すことができます。感覚ではなく数値で確かめることで、より納得感のある意思決定が可能になります。
まとめ
— 相関とは「2つのデータがどの程度一緒に動いているか」を示す関係。
— 相関係数rは−1〜+1の間で、±1に近いほど関係が強い。
— 相関があっても因果関係があるとは限らない。
— Excelの関数で簡単に算出できるため、ビジネスでもすぐ活用可能。
— 「関係の強さ」を知ることで、次に分析すべき要因が見えてくる。
次回は、この相関の延長として「データの関係を“線で表して予測する”」回帰分析についてやさしく解説します。





