データ分析でまず見るべきなのは平均値ではない!? 「統計超入門セミナー」講座風景(門田先生)
公開日
2024年10月24日
更新日
2024年10月20日
和(なごみ)講師、門田先生の講義風景になります。
新宿WakaLaboで随時開催しております統計超入門セミナーの講座風景になります。
統計超入門セミナーの日程はこちら
https://wakara.co.jp/service/personal…
■大人のための統計教室 和(なごみ)とは?
数学、統計に関する様々なセミナーを随時開催しております。
特定の分野などをピンポイントに学びたい方への個別授業、企業様向けへの研修などもご案内しております。
大人のための統計教室 和
https://wakara.co.jp/service/personal…
門田先生のプロフィールはこちら
https://wakara.co.jp/service/instruct…
【運営】和から株式会社
和から株式会社では大人のための数学教室「和」(なごみ)を中心として少人数セミナー、企業研修、ロマンティック数学ナイトなどの数学イベントなどを開催しております。講師・スタッフを募集中!
採用情報はこちら
https://wakara.co.jp/recruit
今日は統計超入門セミナーにお越しいただきありがとうございます
講師を務めさせていただきます
門田実と申します
私はですねこれまで
ニューヨーク大学で数学の博士号を取得し
その後は世界中の色々な研究所で研究を
統計学を使った研究をしてまいりました
今日はですねそのエッセンスだけを積み込んだ
こういうセミナーを開催させていただこうと
まずですね先ほど説明したように
データが与えられた時にまずデータ要約しようと
そのために統計値を使う
みなさんが知っている統計値
こう言うのがあると思います
平均値、中央値、標準偏差、最大値そして最小値
例えばです
この2つのデータですね
見ていくとLinkedin月曜日10,400アクセス
日曜日に関しては-79
閲覧数でマイナスって皆さんあると思います?
何かおかしいですよね
最大値最小値を見ることによって
自分のデータの中に異常値があるのかどうか
そういうことをまず確認できる
データの世界では2ケタ違うと世界が違うと言われています
皆さん身長
おいくつですか
170センチです
2ケタ違うとですね、1.7センチになっちゃう
そうすると全く背が違いますよね
2桁大きくなっても170メートルです
今見てる世界と変わってしまう
こういうようなデータが
自分のデータの中に入ってないことをまず確認する必要がある
そしてですねこれ調べていくと
例えば
打ち間違いで、-79が入っていた
1400っていうのもですね実は打ち間違いで
調べてみると140の間違いだったとこういうことがあります
これをまず平均値や中央値、標準偏差
これを計算する前にやらなきゃいけない
その後ですよね
この平均値中央町計算するの
平均値中央値を調べる意味は何かというとデータの中心を把握する
つまり
どういう自分のデータの中で正代表的な値というのは何なんだろうか
そういう値を求めるために平均値、中央値を計算していく
こういう手順になります
推定というのをどういうふうに使われているか
実例ちょっと見てみましょう
水産庁のホームページに行くとですね
太平洋クロマグロの資源量の推定こういうようなグラフがあります
少し不思議だと思ってください
なぜならば
太平洋に何匹のクロマグロが生息しているのか
これどうやって調べるんだろう
一個一個の答えを
数え上げることは不可能ですよね
ではどうするのかそこで統計的手法を使って
その全体
ここでは太平洋の海の中に生息しているクロマグロの資源料
資源料というのはマグロの数だと思ってください
これを推定すると
皆さんどのように分析を進めていきますか
ここでですねこの科学的思想による問題解決法ということについて
説明させてください
例えばですよ
大学で勉強する学科には化学もしくは
医学、数学いろんな学問がありますよね
ここの中でですよ
どの分野でも問題解決のために使われる共通した思考とありますけど
手法とは何でしょうかと
これ考えて見ましょう
これに対する答えはですねこの「分解と統合」
こういう考え方ってどの分野でも共通して使われる手法
もしくは思考であると言えると
これどういうことかと言いますと
壊れた時計が皆さんの目の前にあることを想像してください
どうやって治しますか
まず皆さん分解しますよね
時計を一つ一つの部品に分解していき問題のある箇所
故障している箇所まず特定しそこを修理しその後に部品を結合して戻す
そうすると問題が解決されていると