【和から株式会社】Excelで学ぶデータ分析講義抜粋
公開日
2024年11月25日
更新日
2025年3月5日

和から株式会社主催「Excelで学ぶデータ分析」の講義の抜粋です。
Excelを用いて統計学の基礎とデータ分析の活用方法を習得できる構成となっています
※動画でもご覧いただけます。
本講座はリニューアルされ「ビジネスのためのExcel統計分析基礎-客観的な意思決定を行う手法を学ぶ-」と名称変更されております。
この記事の主な内容
統計学は本当に必要なのか?
まず最初に、統計学は本当に必要なのかについて考えてみましょう。
例えば、会社の月末会議で問題点を共有し、「次は頑張ろう!」と意気込むだけで、統計学のような難しい知識は必要ないように思えます。しかし、実際の会議でどのような議論が行われているかを振り返ってみると、単純なやる気だけでは不十分なことが分かります。
統計の重要性
仮に、1月の売上がある程度の水準だったとしましょう。2月の売上もまずまずの結果を出し、会議では「3月はもっと頑張ろう」と意気込みます。そして、努力の結果、3月の売上は上昇しました。これを受けて、4月も同様に頑張ることを決めました。
しかし、4月の売上は3月ほど伸びなかったものの、1月や2月よりは良い結果となりました。これは、一見すると「少し停滞している」とも言えます。こうした流れを繰り返しながら数年が経過したとき、売上の推移を振り返ってみると、上がったり下がったりを繰り返しながら、全体の平均値はそれほど変化していないことに気付きます。
この現象は「平均への回帰(Regression to the Mean)」として知られています。これは、統計学者フランシス・ゴルトン(Francis Galton)が発見したもので、彼は遺伝学の研究の中でこの概念を明らかにしました。
データ分析の基本
では、統計学を活用したデータ分析について考えてみましょう。
今回使用するデータは、企業の人事データであり、以下のような項目を含んでいます。
ID: 従業員の識別番号
満足度: 仕事に対する満足度
他者評価: 上司や同僚による評価
データ分析を行う際には、まずその目的を明確にする必要があります。これを「第0ステップ」と呼びます。何を知りたいのかが明確になったうえで、以下の4つの分析ステップに進みます。
■データ分析の4つのステップ
①データの要約: 収集したデータの傾向を把握する
②データの関係性を確認: 各変数間の相関などを分析する
③予測: 未来のデータを推測する
④結果の検証: 分析結果が妥当であるかを確認する
このプロセスにおいて、「分解と統合の哲学」が非常に重要になります。データを細かく分解し、要素ごとの影響を明らかにした後、それらを統合して全体像を把握するという考え方です。
データの種類を理解する
データ分析を始める前に、自分が扱うデータの種類を把握することが重要です。
データには大きく分けて以下の2種類があります。
①量的データ: 数値で表現されるデータ(例:年齢、売上、評価点数)
②質的データ: カテゴリーや文字列で表されるデータ(例:性別、職種、部署名)
これらのデータは集計方法や可視化の方法が異なるため、まずはデータの種類を明確にすることが重要です。
相関係数に関する注意点
データ間の関係性を測る指標のひとつに「相関係数」があります。相関係数が0に近い場合、「相関がない」と判断されがちですが、これは必ずしも正しいとは限りません。
例えば、以下のような散布図を考えてみましょう。
・データが円状に分布している
・直線的な関係は見られないが、明らかな規則性がある
このような場合、相関係数は0に近い値になります。しかし、これは単に「直線的な関係がない」ことを示しているだけであり、「まったく関係がない」とは言えません。相関係数はあくまで直線的な関係性の強さを示すものであり、それ以外のパターンを捉える指標としては機能しないのです。
実践:男女間の賃金格差の分析
最後に、データ分析の実践例として、「男性と女性の看護師に賃金格差があるのか?」という問題を考えます。
この問題を分析するために、重回帰分析を用いて以下の手順を実行します。
データの準備:
男性看護師のデータをコピーして、新しい列「男性ダミー」を追加する。
「男性ダミー」は、男性なら1、女性なら0とする。
分析の実施:
性別が賃金に与える影響を統計的に検証する。
このように、統計的なアプローチを用いることで、データから客観的な結論を導き出すことができます。
まとめ
統計学は、単なる数字の分析ではなく、ビジネスの意思決定を科学的にサポートするための重要なツールです。売上の推移を分析するだけでなく、データの関係性を正しく理解することで、より有効な戦略を立てることができます。今回の内容を活用し、より効果的なデータ活用を目指しましょう。