やさしく学ぶ統計学~ヒストグラムとは~
公開日
2022年12月18日
更新日
2022年12月18日
↓↓↓動画で見たい方はこちら↓↓↓
みなさんこんにちは。和からの数学講師の伊藤です。先日のマスログでは、度数分布表の考え方を紹介しました。
今回は、この度数分布表を用いてヒストグラムと呼ばれるグラフをご紹介します。ヒストグラムが活用される場面は多岐にわたりますので、ぜひ今回の内容から使い方を覚えておきましょう!
この記事の主な内容
1. 度数分布とヒストグラム
度数分布表は、データをいくつかの区間に分割して、それぞれの区間に属するデータの数をまとめた表でした。今回は、以下のような度数分布表を考えましょう。
100点満点のテストを受けた生徒80人の得点の度数分布表となっています。表の中の「0点以上20点未満」のような区間は各階級と呼び、各階級の中に含まれるデータの数を度数と呼びました。その他の用語は以前の記事で解説しています。
ヒストグラムは、横軸を各階級、縦軸をその階級に属するデータの度数として棒グラフを描いたものです。
どの階級にどれくらいの数のデータが属していたのかを調べるという意味で、データの分布を可視化したグラフと見ることができます。
なお、今回は度数分布表に合わせた表記をしていますが、本来のヒストグラムは横軸を実数直線にして描きます。また、棒と棒どうしは感覚を空けずに描くことが多いですが、Excel等で出力する際には間が空いたヒストグラムが出力されるので、今回はその表記に合わせています。
2. 棒グラフとヒストグラムの違い
ヒストグラムと棒グラフの大きな違いは、その使用目的にあります。棒グラフの目的は、単純に大きさを比較するというものでした。大きさの比較に関しては、折れ線グラフなどよりも伝わりやすいというのが棒グラフのメリットでした。
一方ヒストグラムの目的は、データの分布を可視化するという点にあります。つまり、どこにデータが多くて、どこに少ないのかを確認したい場合に使うのが有効です。したがって、ヒストグラムは横軸に階級、縦軸に度数をとるという決まりがあります。
3. ヒストグラムの応用
ヒストグラムを応用して、グラフの中に色を塗って内訳を表現することが可能です。たとえば、先ほどのテストの成績を男女別に分けると次のようになります。
また、もともとのヒストグラムは度数を可視化していたのに対し、相対度数や累積度数を用いた可視化をすることも可能です。
このように、ヒストグラムはデータを分析する際に幅広く活用できます。ぜひヒストグラムを使ったデータの可視化を覚えておきましょう!
●和からのセミナー案内
和からではデータ分析に関するセミナーを多数用意しています。興味のある方は是非一度無料講座へお越しください。
●和からのセミナー一覧はこちら
●お問い合わせフォームはこちら
<文/伊藤智也>