マスログ

箱ひげ図で学ぶデータのばらつき-第1回:一本の箱で“データの性格”が丸わかり【統計学をやさしく解説】

公開日

2025年11月18日

更新日

2025年11月14日

はじめに:平均だけでは見えない“データの顔つき”

ビジネスデータを見るとき、多くの人がまず確認するのは「平均値」です。しかし、平均だけではデータの性格はほとんどわかりません。そこで大きな力を発揮するのが箱ひげ図です。箱ひげ図は、データがどんな広がり方をしているのか、どこが中心なのか、そして極端な値があるのかを、たった1つの図で表せる非常に便利なグラフです。

この記事では、箱ひげ図の読み方を、ビジネスパーソンの初心者にもわかるようにやさしく解説します。



箱ひげ図とは?:まずは形から覚える

箱ひげ図は、データの「散らばり」をひと目で表すためのグラフです。次の5つの値を使って構成されます。

・最小値(Minimum)
・第1四分位数:Q1(下位25%地点)
・中央値:Median(50%地点)
・第3四分位数:Q3(上位75%地点)
・最大値(Maximum)

このうち、Q1とQ3に挟まれた部分が「箱」になり、中央値を示す線が箱の中に引かれます。箱の上下に伸びる線が「ひげ」で、データのおおよその範囲を示しています。

● 箱が表す意味

箱の大きさは、「データの真ん中50%がどれだけ広がっているか」を表します。箱が長ければばらつきが大きく、箱が短ければデータが比較的まとまっていることを意味します。

● 中央値がずれている意味

箱の中心に引かれた線が中央値です。中央値が箱の中央から上にズレていれば「低い値側にデータが多い」、逆に下にズレていれば「高い値側にデータが多い」という傾向が分かります。つまり、箱の中で中央値がどこにあるかを見ることで、「どちら側にデータが寄っているか」を直感的につかむことができます。


平均・棒グラフでは気づけないことが見える

例えば、2つの店舗AとBの1日の売上平均がどちらも「5万円」だとします。しかし、実際には次のような違いがあるかもしれません。

・店舗A:毎日ほぼ4.5〜5.5万円で安定している
・店舗B:3万円の日もあれば8万円の日もあり、ばらつきが大きい

平均だけを見ると「どちらも5万円の店」として同じように扱ってしまいますが、実態はかなり違います。ここで箱ひげ図を使うと、店舗Aは箱もひげも短く「安定した売上」であることがわかり、店舗Bは箱やひげが長く「日によるバラつきが大きい店」であることが一目で分かります。

このように、箱ひげ図は「平均値では見えない違い」を視覚的に見せてくれるので、ビジネスで安定性やリスク、傾向を把握するのに非常に役立ちます。


四分位数をやさしく理解する

箱ひげ図を読み解くうえで重要なのが四分位数(しぶんいすう)です。少し難しそうな言葉ですが、考え方はシンプルです。

・Q1:データを小さい順に並べたときの下から25%地点
・中央値:ちょうど真ん中(50%地点)
・Q3:上から25%を除いた地点(全体の75%地点)

つまり、Q1〜Q3の範囲は「データの真ん中50%がどこに集まっているか」を表しているにすぎません。「四分位数」という専門用語に身構える必要はなく、「データを4つに割ったときの区切り」と理解すれば十分です。


実例で理解しよう:従業員の年齢を箱ひげ図にしてみる

例えば、ある会社の従業員20名の年齢を調べて、箱ひげ図を作ったとします。その結果が次のようなイメージだったとしましょう。

・中央値:31歳
・Q1:28歳、Q3:36歳
・最小値:22歳、最大値:48歳

● ここからわかること

・真ん中50%の従業員は、おおよそ28〜36歳に集中している
・20代後半〜30代前半の人が多い会社だと分かる
・最大値48歳の「ベテラン層」が少数いる

このように、箱ひげ図を見るだけで「年齢層の分布」が一発でイメージできます。一方で、「従業員の平均年齢は30.8歳です」とだけ言われても、若手が多いのか、ベテランが多いのか、どれくらい偏りがあるのかまでは分かりません。

箱ひげ図は、数字の一覧や単なる平均値よりも、「この集団はどんなメンバーで構成されているのか?」を直感的に教えてくれます。


箱ひげ図は“データの性格診断”ツール

ここまで見てきたように、箱ひげ図は次のような情報を1つの図でまとめて教えてくれます。

・中心(中央値)がどこにあるか
・ばらつき(箱の長さや、ひげの範囲)がどれくらいか
・偏り(中央値が箱の中央からズレているかどうか)
・極端な値(外れ値)が存在するかどうか(※外れ値の詳細は次回解説)

たった1つの図で、データの性格を丸ごと把握できるため、レポート作成、現状分析、施策の効果検証など、さまざまなビジネスシーンで活用できます。

「平均値しか見ていなかった」という人ほど、箱ひげ図を使い始めると、データの見え方がガラッと変わるはずです。



次回予告:1.5倍ルールで外れ値を見つける

第1回では「箱ひげ図の読み方」を中心に、データの散らばりをざっくりつかむ方法を紹介しました。次回の第2回では、箱ひげ図のハイライトともいえる「外れ値の見つけ方」をさらに詳しく解説します。

・IQR(四分位範囲)とは何か
・1.5×IQRルールはなぜ使われるのか
・実際のデータで外れ値をどう見つけるか

ビジネスで「この数字だけおかしくないか?」「この異常値は無視していいのか?」と迷う場面で役立つ考え方の土台になります。ぜひ続けて読んでみてください。

新着記事

同じカテゴリーの新着記事

同じカテゴリーの人気記事

CONTACTお問い合わせ

個別講義や集団講義、また法人・団体向けの研修を行うスペース紹介です。遠人に在住の方や自宅で講義を受けたい方はオンライン講座をご用意しております。よくある質問はこちら