Meun
close
050-5490-7845 ※ 月曜定休日
  • twitter
  • facebook
  • YouTube

マスログ

2022/03/07

はじめての統計学~データを要約しよう~


こんにちは。和からの数学講師の岡本です。「はじめての統計学」シリーズです。今回は「データの要約」についてざっくりと解説していきたいと思います。前回の内容はこちらから!

はじめての統計学~ヒストグラムの扱い方~

1.データを要約しよう

手元にたくさんのデータがあるとき、それを理解したり相手に伝える際、大量のデータをそのまま見せてもなかなか整理がつきません。そのためにデータの特徴を数字でおさえ、簡潔にまとめることが重要になってきます。データを見るとき、最初に確認しなければならないのは、そのデータが「質的データ」なのか「量的データ」なのかです。こうしたデータの種類に関しては以下のマスログで解説しています。

はじめての統計学~データの種類について~

2.質的データの要約

まずは「質的データ」の要約について考えてみましょう。文字のデータは一般に足し算ができないので、「平均値」や「最大値」などといった概念はありません。そのため、要約は単純に「カウントする」ことが中心になります。例えば、「喫煙の有無」というデータに関しては「あり」が何人で、「なし」が何人なのかをカウントするだけです。

Excelであれば、ピボットテーブルを使うことにより、簡単に集計することができます。さらに、割合で表現したいとき、全体の人数で割ることによりパーセントで表すこともできます。

3.量的データの要約

「量的データ」の要約には様々な道具が活用できます。数字のデータは四則演算が可能になるので、以下のような指標により特徴をまとめることができます。

・平均値
・中央値
・最頻値
・最大値
・最小値
・標準偏差
・四分位範囲
など

これらの指標は総じて要約統計量(summary statistic, representative value)といいます。例えばこちらのデータをご覧ください。このデータの特徴、つかめますか?

目がチカチカしますね笑。 5個や10個程度のデータであれば、数字の並びだけである程度の特徴を捉えることができるかもしれませんが、100個や1000個、10000個といった量にもなると、データを眺めるだけで特徴を捉えることが難しいですよね…。そんなとき、要約統計量を使うことで簡潔にデータの性質を整理することができます。具体的な要約統計量に関しては次回以降に詳しく解説していきたいと思います。

●和からのセミナー案内

集計やデータの可視化に関するスキルは自然に身に付くものではありません。和からでは、社会人のためのデータ集計・可視化、ピボットテーブルの使い方に関する講座をいくつか実施しております。興味のある方は是非一度無料講座へお越しください。

集計と可視化で学ぶデータ分析超入門

データ利用・活用超入門-データを情報に変える統計学-

文系のための「統計超入門セミナー」-目で見てわかるビジネス統計学-

●参考文献


人文・社会科学の統計学 (基礎統計学) 東京大学教養学部統計学教室(編) 東京大学出版会

●和からのセミナー一覧はこちら
●お問い合わせフォームはこちら

<文/岡本健太郎>