マスログ

データ分析でまず見るべきなのは平均値ではない!? 「統計超入門セミナー」講座風景(門田先生)

公開日

2024年10月24日

更新日

2025年1月14日

和(なごみ)講師・門田先生の講義風景
こちらは、「統計超入門セミナー」の講座風景です。このセミナーでは、統計に初めて触れる方や基礎をもう一度しっかり学び直したい方向けに、データ分析の基本から応用までを丁寧に解説しています。

講義の内容

皆さん、こんにちは。
本日は「統計超入門セミナー」にご参加いただき、誠にありがとうございます。講師を務めさせていただきます門田実と申します。
私は、ニューヨーク大学で数学の博士号を取得し、その後、アメリカ、ヨーロッパ、アジアを中心としたさまざまな研究機関で統計学を活用した研究に携わってきました。本日は、その中からエッセンスを抽出し、初心者の方でも理解しやすい形で統計学の基礎をご紹介させていただきます。

データ分析の基本

データ分析の第一歩は、与えられたデータを要約することです。そのために必要なのが「統計量」です。統計量には以下のような種類があります:
平均値(Mean)
中央値(Median)
標準偏差(Standard Deviation)
最大値(Maximum Value)
最小値(Minimum Value)

最大値と最小値の重要性

多くの教科書では、平均値や中央値から学び始めることが多いですが、実際のデータ分析では「最大値」と「最小値」を最初に確認することが重要です。なぜなら、これらを確認することで、以下のような情報を得ることができるからです:

異常値(アウトライヤー)が存在するかどうか
データのばらつき(範囲)

例えば、LinkedInのアクセス数データで「月曜日:10,400」「日曜日:-79」という数値があった場合、-79という値が異常値である可能性を考える必要があります。このような異常値を確認しないまま平均値や中央値を計算すると、結果が大きく歪む可能性があります。

平均値や中央値の役割

最大値や最小値を確認した後、次に平均値や中央値を計算します。これらは、データ全体の中心的な傾向を把握するための重要な指標です。
平均値:データ全体のバランスを示します。
中央値:データを昇順に並べた際の真ん中の値で、極端な値の影響を受けにくいのが特徴です。

統計的推定の実例

例えば、水産庁のホームページには「太平洋クロマグロの資源量の推定」というグラフが掲載されています。太平洋全体に何匹のクロマグロがいるのかを正確に数えることは不可能ですが、統計的手法を活用することで、その資源量を推定できます。このように、統計学は計測が困難な大規模なデータや事象を分析し、全体像を把握するために役立つツールです。

科学的思考「分解と統合」

科学的な問題解決には、「分解と統合」という思考方法が活用されます。例えば、壊れた時計を修理する際には、まず時計を分解して問題箇所を特定し、その後に再度組み立てるプロセスを取ります。このようなアプローチは、統計学やデータ分析を含むあらゆる分野で応用されています。
本日のセミナーでは、このような基礎的な統計の概念から、データ分析の実践的な手法までを学んでいきます。どうぞ最後までお楽しみください!

新着記事

同じカテゴリーの新着記事

同じカテゴリーの人気記事

CONTACTお問い合わせ

個別講義や集団講義、また法人・団体向けの研修を行うスペース紹介です。遠人に在住の方や自宅で講義を受けたい方はオンライン講座をご用意しております。よくある質問はこちら