【和から株式会社】統計超入門
公開日
2024年11月11日
更新日
2024年11月28日
和から株式会社で実施している無料セミナー「統計超入門」の冒頭動画です。
数式を使わずに統計学の概要をつかみたい方は、是非、統計超入門セミナーにご参加ください。
◎概要・開催日程はこちら→https://wakara.co.jp/course/4320
#和から #統計 #集団セミナー
本日の統計超入門セミナーにお越しいただきありがとうございます
それではまず最初に統計学の歴史から入っていこうと思います
これはの統計学勉強された事ある方
もしかしたらいらっしゃるかもしれません
今日は、統計超入門セミナーなので
それこそ今日初めて統計学を勉強するっていう方向けなので
勉強今日初めてだという方ももちろんいらっしゃると思います
ただ勉強された事ある方でもやっぱり歴史を勉強された事ある方って
なかなかいらっしゃらないと思うんですよ
うちのセミナーでは歴史っていう部分非常に重きを置いています
これはの統計学に限らず
何か学問の勉強する際は歴史から入った方がいいんですね
というのも
学問というのは必要性があってできたものです
その必要性理解しないとやっぱやっててモチベーションは分からないですし
何のためにやってるかわかんないんですよ
なので
今日も統計学の歴史からお話をしていきたいとおもいます
そもそも統計ってどういう始まりなのというところです
実は統計学
現在知られている統計学というのは
三つの大きな柱からなると言われていて
1つが国の実態を捉えるための「統計」
もう一つが大量の事象を捉えるための「統計」
3つ目が確率的事象を捉えるための「統計」
この3つなんですね
でもこうそれぞれ何言ってるかよくわかんないということで
ちょっと一つずつ見ていきましょう
まずはそのこの中で一番早い最も古いものってなんなのか
ルーツを見ていきたいんですが
これもあのルーツを見ていく手っ取り早い方法があって
語源を見ていくという方法があります
じゃあ統計学の語源はなんだということで
英語に直すとstatisticsといって
あんまり一般的じゃないですよね
じゃあこのstatistics
実はラテン語からきていて
あのこれ何て言うのかというとステータスと言うんですよ
ステータスっていうのは聞いたことある方はたくさんいらっしゃると思います
僕のステータスあなたのステータスって何か状態を話すようなイメージですよね
実際にこれがラテン語の意味では国家や状態に由来すると言われています
じゃその国家や状態に由来する統計学って今風の言葉でなんていうかと
国勢調査です
ということで統計学のルーツ
始まりというのは国勢調査だったということが分かりました
非常に面白いですよね
じゃあ歴史をひもといてみましょう
いつ国勢調査が始まったのか
現在知られている最も古い国勢調査というのは
実は古代エジプト
今から5000年ぐらい前の話ですね
当時にピラミッド建設の時に行われたと言われています
非常に古いです
日本では一番古いのは班田収授法とかって言われる法律
これが一番古い国勢調査だと言われています
こう時代が登って産業革命時は
ナポレオンによって統計学が発展してきたと
皆さんのそのナポレオンって統計やってるイメージあんまりないと思うんですよ
馬に乗ってるイメージあると思うんですけど
あの戦争しているイメージがあると思います
当時そのやっぱり戦争の時代ですね
ナポレオンは戦争していく上で何を大事だと思ったかというと
もちろん相手の国について知らないといけない
これを先ず一つあります
もう一つ大事なのは自分の国について知らないといけないですね
じゃないと戦争をやっていけないわけですよ
そこで国の直轄の機関
正式な機関として統計局というのを設置した
なので
ナポレオンっていうのは統計学の世界でも非常に大きな仕事をした
偉人だと言われています
ということでこういう国の指導者によって
この統計学というのが発展してきたという流れです
これが一つ目の国の実態をとられたのが統計
じゃあもう一つの大量の趣旨を捉えるための統計というのは何なのかと
いうところでこれちょっとそのまま言葉を読んでもわかりにくいです
あの辞書で調べてみるとこう書いてるんですね
偶然とみられる現象に規律を探求する手法としての統計と
これもちょっと何言ってるかわかんないわけですよ
じゃあ偶然見られる現象って何があるのかっていうのも考えてみましょう
例えば人の死なんてそうですよね
僕はいつ死ぬのかとか
完全にその
偶然に支配されているようなイメージですよね
しかしこれはどうでしょう
例えば20代の男性で100人ね80代の男性じゃなくても
20代の方100人
80代の方100に2つのグループを連れてきました
どちらのグループが先に死亡しますか
ではどちらのグループが死亡率が高いですかというのを考えた時
これ今となって自然ですけどそれはもちろん高齢のグループの方が
死亡するリスクが高いですよね
これはわかりますよね
ただこういうのって実は昔からわかったわけじゃないんですよ
まあ昔だったらそ80歳のおじいちゃんであっても
元気そうだったらまだこの人は40年50年生きるんじゃないか
というふうに思われてたぐらいで
年齢に応じて死亡するリスクが高くなるっていうのは結構最近なんですね
それこそ近世になってようやく集計の結果分かったと
それを発見者のがこの表の真ん中に帰っているエドモンドハレーさんという方です
当時ですね
イギリスの話なんですが
イギリスには死亡届を提出する習慣というのがありました
逆に言えば
教会に行けば死亡に関する大量のデータが取得できるわけです
このエドモンドハレーさんという方は
そこに目をつけて教会に行って死亡に関する大量のデータを
ちゃんと集計したと
そうすると年齢に応じて
高齢になるにつれて死亡する人が増えているっていうのを見つけました
これがあの大量の事象を捉えるための統計の始まりだと言われています
これ実際何に使われたかというと
先ほど少しお話しました
生命保険とか保険会社の保険金保険料の
設計に使われたわけですね
ハレーさん鋭いですね
これ実はハレー彗星のことなんですね
あのエドモンドハレーって聞いてもピンと来ないと思うんですが
この実はそのハレー彗星のハレーさんです
こう言う風に統計学の歴史を勉強するだけでもいろんなところと
結びついてそれこそさっきのナポレオンもそうですし
非常に面白いです
ということでまぁ学問始める前は歴史から入っていきましょうという話です
こういった形で大量の事象を捉えるための統計というのが発展してきました
最後残っているのは確率的事象を捉えるための統計
これ年表を書いていますが
こうざっと見る限りちょっと面白いんですよ
サイコロ、ゲーム、賭博
なんだかすごいギャンブルな感じの言葉がたくさん並んでます
これは3番目の源流って言うのが非常に
同期としてはもっと不純なんですが
ゲームや様は
サイコロや賭博こういったものでいかに勝てるか
っていうのを学者たちがいたって真面目に研究した結果生まれたのが
この確率論と言われるものです
非常に不純なんですが
この確率という概念は非常に重要で
今でも非常いろんなとこで使われています
それこそあの
降水確率とかでも今でも聞きますし
この確率な概念っていうのが発展してきて
統計学、特にデータ分析実践手法の部分だったり
数的なところというのは非常に爆発的に発展してきました
この3つが合わさって統計学というのが成り立っているわけです
では続いてその統計学にも
実は大きく分けて2つに分かれます
種類があって一つが記述統計学
もう一つが推測統計学と言われています
記述統計学って何かというと
データを実際に整理して集計して
グラフに可視化をするとこういったところ
要はそのデータの特徴をとらえていくというのが記述統計
推測統計というのはそれ以外ですね
例えば実際の分析の手法にあたります
数理的な部分というのがこの推測統計にあたります
実際にサンプルから全体を予測したり
検定とか相関分析、回帰分析という風な実際の分析の部分が
この推測統計にあたります
はいということでちょっとずつ
統計学やデータ分析の話にシフトしていきます
PREV
タクシー数に興奮した話