「数字の苦手」を克服!データ分析初学者のためのステップバイステップ学習ガイド
公開日
2024年11月17日
更新日
2024年11月16日
上司:「A君、少しいいかな?」
A君:「何でしょうか」
上司:「今世間ではDXが注目されているけど、今回うちでももっとデータ活用をしていこうということになったんだよね」
A君:「な、なるほど・・・」
上司:「A君はデータ分析を学んだことはある?」
A君:「な、ないです・・・」
上司:「だったらよい機会だから、データ分析を推進していく役割をA君に任せたいと思うんだよね。」
A君:「でもデータ分析やったことなんて・・・」
上司:「A君なら大丈夫。勉強しながらでもよいから、その役割を担ってくれないかな。まずは簡単なものでよいから、今年の売上状況をデータでまとめて、来年にどういった戦略で事業展開すべきかを、まとめてくれないかな?」
A君:「・・・」
こんにちは。和からの川原です。
皆さんは上記のような状況に出くわしたことはありませんか?データが非常に注目されている現代社会で、突然のように分析を行わないといけない状況になることは珍しくありません。このような中で、データ分析を学んだことがない方は何から学べばよいか迷ってしまうようです。そこで今回は弊社のセミナーを例にして、Excelを用いて簡単なデータ分析ができるようになるための最強ロードマップ(Excel分析編)を紹介していきます。
以下の流れで学習を進めると挫折することなくスムーズにデータ分析の力が身につきます。
この記事の主な内容
1.統計学で何ができるか、全体像を知ろう!
初学者の方がまず初めに行うことはプログラミングツールを導入することでもなければ数学を勉強することでもありません。最初に行うべきことは全体像の把握です。何事も勉強はまず全体像を把握してから行った方が長続きします。データ分析も同じく、これを学んだ先に何ができるようになるのか、それを把握することがまず第1です。
そのためのセミナーがこちら。
詳細・お申し込みは▶こちら
こちらではデータ分析の全体像を基礎から紹介する、すべての方の学習の入り口となるセミナーです。目標の設定やゴールの設定なしに学びを始めることは、ゴールのないマラソンを行うようなもの。自分はなぜ走っているのか、どこに向かえば良いのかが分からなくなり、途中でやめてしまうことになりがちです。そのならないためにまずはデータ分析の全体像を把握し、学習を進めることで何ができるようになるのかを把握することが大切です。
セミナー内で、ビジネスにおけるデータ分析の使い方や、統計知識の基礎をご紹介していきます。
データをまとめて記録!分かりやすいように可視化する!
現状の問題点は何か?データを用いて探索する!
このセミナーの特徴は何といっても知識ゼロからスタートできる点です。今までにデータ分析を学んだことがない文系の方でも安心して受講できます。また、無料でご参加できますのでお気軽にお越しください。
2.Excelでデータをまとめる力を身に着けよう!
データ分析の全体像を学んだ次のステップで行うことは、Excelを使ったデータ分析実践です。データ分析は座学としての知識も大切ですが、やはり分析できるようになることが大切ですから、その練習を行っていきましょう。
詳細・お申し込みは▶こちら
こちらのセミナーではこれから分析を始める方に向けて、実際のデータを触りながら分析手順を学んでいくものとなっています。その分析練習に使うツールでおすすめなのがExcelです。普段の業務で使っている方も多く、なじみのあるツールですが、実はExcelはデータ分析をも行える非常にパワフルなツールです。そのExcelを用いてデータの扱い方を学びましょう。
例えば「今年度の業績をデータで把握して、来年の戦略を考える」というテーマで分析を行おうとしたとき、何から始めれば良いでしょうか?
弊社の売上データから何が分かる?
いきなり分析をやってくれ、と言われると何から始めればよいか戸惑ってしまうのもですが、最初に行うべきことは集計と可視化です。
売上を項目に分解して現状を把握する
Excelでデータをまとめながら、また時には細かく分解を行いながら、そのデータにどういった特徴があるのか、今何が起きているのかを把握していきます。このようなデータとにらめっこしながら特徴を捉えていく分析を別名EDA(探索的データ分析)と言ったりしますが、これがまさしくデータ分析の入り口となるものなのです。こちらはすべてExcelのピボットテーブルというツールを用いて行うことが出来ますから、その練習を徹底的に行っていきましょう。
この分析はやり方さえ覚えれば誰でも行えます。このスキルを身に着ければデータを分析してくれと言われてももう何を行えば良いか悩むことはありません。
3.データに潜むパターンを見つける力を身に着けよう!
Excelを用いればデータにどういった傾向があるかを見つけることができます。しかし、上記のように集計と可視化でデータに含まれるパターンを見つけるのもデータが複雑になればなるほど大変になってきます。その際に学んでおくと便利なのがデータの特徴を機械的に抽出するデータマイニングです。
詳細・お申し込みは▶こちら
データマイニングとはデータの特徴を抽出するための技術です。上記で説明したように、集計と可視化を用いて特徴を抽出することも立派なデータマイニングではあるのですが、ここでは少し高度な手法を使ってマイニングを行っていきましょう。
例えばお客様へ行ったメールキャンペーンのデータから、どういったお客様がそのキャンペーンに反応しやすいか、その特徴を抽出したい状況を考えましょう。
キャンペーン履歴のデータから何が分かる?
たくさんの列があるデータで1つずつグラフを描いて特徴を把握することは大変ですが、データ分析の世界には決定木分析という手法があります。こちらを使えば、どういった方がキャンペーンに反応しやすいかを図で確認することが出来ます。
キャンペーンに反応しやすい人の特徴が明らかに!
こちらの図の読み方の詳しい説明は割愛しますが、上記の図は過去1年間で購買金額が約75,000円以上で、約119,000以下である方はキャンペーンに47%の割合で反応している、ということが書かれています。このようにデータの特徴を機械的に把握する分析手法が決定木分析です。
決定木分析は機械学習という分析手法の一例です。初めての方は何やら難しいという印象を抱くかもしれませんし、またExcelではその分析ができないので、そのような分析は初学者にはハードルが高いという印象があるかもしれません。しかし今はその学習環境も変わりつつあります。ChatGPTなどのAIツールが使えるようになった今では、少し高度な分析手法も気軽に行うことが出来るようになりました。1からプログラムを書く必要がなくなったため、初学者の方がこのタイミングで少し高度な分析手法に触れておくことは非常に有益となるでしょう。上記のセミナーでは決定木分析を弊社が開発したwebツールを使って実装します。(皆さんもそのツールをお使いいただけます。)
4.偶然か否かの判断ができるようになろう!
ここまででデータの把握ができるようになりました。ここまでを学んだA君も十分にビジネスでそのスキルを発揮していますが、もう少し学ぶべきことがあるようです。先ほどの上司とA君の会話の続きを見てみましょう。
A君:「データの分析を行ってみました。」
上司:「ありがとう。何か特徴的なものは見つかった?」
A君:「今年の夏に行ったメール会員キャンペーンが効果が出ている傾向が見えます。メール会員になった方の購買単価が11,000円、なっていない方の購買単価が10,000円となっており、来年もこのキャンペーン促進を続けていくことが必要かと思います。」
上司:「会員になった方となっていな方で購買単価に差がある様に見えるけど、これ本当にキャンペーンの効果はあるの?この差は誤差の範囲では?」
A君:「・・・」
コンビニで数万円のお買い物をしていくお客様がいるように、大きな世界情勢の変化がなくても為替は毎日微動するように、データには必ず偶然によるばらつきが存在します。本当にキャンペーンが効いたのか、それともたまたまこの期間のデータが上振れているだけなのか、そういった判断が行えるようになると分析の結果が客観的になります。そういった偶然か否かの判断を行うためのスキルを次に学びましょう。
詳細・お申し込みは▶こちら
偶然か否かの判断は推測統計学という確率を用いた分析で行うことが出来ます。確率というと難しそうに思えますが、これも分析はExcelが行ってくれるので、その結果の読み方を理解すればすぐにでも使えるようになります。
メールクーポンの有無で購買率は変わる?
また推測統計を学べば複数のデータを一度に扱うこともできるようになります。例えば多くの企業は毎月様々な媒体に広告を出しており、その複数の広告費と売上との関係を分析したい、という状況があるでしょう。このようなときに便利なツールが推測統計学。これを使えば「仮にAの媒体に○○円、Bの媒体に●●円投資すると、売上は△△くらいになる」、そういった分析も行えるようになるのです。
売上を予測する統計モデル(回帰分析)を作ってみよう!
5.因果関係の有無を見つける力を身に着けよう!
推測統計まで学べば非常に多くの分析ができるようになっていることでしょう。しかし、ここまで学んできた皆さんにはぜひ因果推論という分野を学んでいただきたいのです。次に学ぶべきものはデータから因果関係について推論する力です。
詳細・お申し込みは▶こちら
「広告を出すと売上が上がる」というような関係性が見えてきたとき、それが本当に施策の効果によるものなのか、それとも他の要因によるものなのかを正確に判断するにはどうしたらよいでしょうか?実はデータ分析の世界には「関連性がある様に見えても実は関連がなかった」というような状況が多々起こるので、その判断を正しく行うスキルが必要となります。それが因果推論という分野です。
例えば、スマホアプリのTVCMを行った企業が広告の効果を明らかにするためにデータの関係性を分析してみました。するとTVCMに接触した人の方がアプリのTVCMに接触していない方より利用時間が短いという結果が出てきました。なぜこのようなことが起きたのでしょうか?
TVCMは逆効果!?
実はこの例では、本来TVCMの効果はあるのですが、偽の因果関係という現象が起きており、正しい結果が出力されていません。なぜこのようなことが起きるのか、どうすればそれを回避できるのか、どういった分析を行うべきなのか、そのようなことを学ぶのが因果推論という分野です。どの分野でもデータ分析を行った後に待っているのは何かのアクションです。誤った分析結果から誤った判断をしてしまわないように、正しく因果関係を読む力を学びましょう。
終わりに
データ分析の分野はこれですべてではありませんが、ここまで学べばかなり多くの分析を行えるようになっているでしょう。ここでご紹介した各セミナーは実務に役立つ内容が多いため、A君のようなお悩みを持っている方はぜひこちらの順番でデータ分析を学んでみてください。
データ分析の世界はまだまだ広いですから、次回は別の分野のロードマップもご紹介していこうと思います。次回もお楽しみに。
<文/川原祐哉>
ベストセラー「統計学は最強の学問である」のマンガ版が出るそうです。
マンガ 統計学が最強の学問である 西内啓(著),うめ(イラスト) ダイヤモンド社