マスログ

データを“見る”統計グラフ-第1回 散らばりと箱ひげ図【統計学をやさしく解説】

公開日

2025年10月12日

更新日

2025年11月25日


はじめに:数値だけでは見えない“ばらつき”を可視化する


前シリーズ「データの散らばりとは?」では、分散や標準偏差を通じて“ばらつき”を数値で理解しました。今回からは、そのばらつきを“見える化”する方法に焦点を当てます。テーマは 箱ひげ図(はこひげず)。一見すると難しそうですが、実はデータの特徴を一目で理解できる非常に便利なグラフです。


箱ひげ図とは?:データを「箱」と「ひげ」で表す

箱ひげ図(Box-and-Whisker Plot)は、データの散らばりを視覚的に表現するグラフです。特徴は、データ全体を「四分位数」という4つの区間に分けて表示する点にあります。

箱ひげ図の基本構成は次の通りです:

■ 箱の中央線:中央値(データの真ん中の値)
■ 箱の両端:第1四分位数(Q1)と第3四分位数(Q3)
■ ひげ(線の部分):データの範囲(外れ値を除く)
■ 点:外れ値(極端に離れた値)


四分位数をやさしく理解する

「四分位数」という言葉を聞くと難しそうですが、考え方はとてもシンプルです。データを小さい順に並べて、全体を4等分したときの区切りを指します。

第1四分位数(Q1):下位25%の境目(データの下側の中心)
第2四分位数(Q2)=中央値:全体の真ん中
第3四分位数(Q3):上位25%の境目(データの上側の中心)

これらをつなぐと、データの「中心」と「広がり」を同時に把握できます。


箱ひげ図から読み取れる3つのポイント

箱ひげ図を見れば、次のような情報が一目でわかります:

データの中心:箱の真ん中にある線(中央値)で把握
ばらつきの大きさ:箱の幅が広いほど、データの散らばりが大きい
偏り(歪み):箱の中心線が左寄りなら「右に歪む」、右寄りなら「左に歪む」

このように、箱ひげ図は「分布の形」を直感的に見せてくれるグラフです。たとえば、営業チームの売上データを比較すれば、「どのチームが安定しているか」「外れ値(突出した営業成績)があるか」も一目で判断できます。


外れ値(Outlier)とは?:平均では見えない重要な存在

外れ値とは、他のデータから大きく離れた値のことです。多くの場合、ひげの範囲を超えて点として描かれます。

外れ値は「ノイズ(誤差)」であることもあれば、「重要なシグナル」である場合もあります。たとえば、ある月の売上が異常に高かったとき、それが偶然か成功施策の結果かを見極めることが、ビジネス判断の鍵になります。


ビジネスでの活用例

箱ひげ図は、ただのグラフではなく、ビジネスに活かせる強力な分析手法とも考えられます。次のような使い方ができます。

営業成績の比較

チームごとの売上分布を比較し、平均だけでなく「安定性」や「成果のばらつき」を把握する。

顧客満足度の分析

アンケート結果を箱ひげ図で可視化することで、満足度のばらつきや不満層の有無を確認できる。

広告キャンペーンの評価

クリック率や獲得単価などのデータを箱ひげ図で比較し、成果が安定しているかを評価する。



まとめ:箱ひげ図は“データの個性”を見抜くレンズ

箱ひげ図は、平均や標準偏差だけでは見抜けない「データの全体像(中心・広がり・偏り・外れ値)」を、ひと目で比較できる強力なツールです。特にビジネスでは、チーム・店舗・期間・施策など複数グループの成績を公平に見比べるのに向いており、外れ値に引っ張られにくい中央値(箱中央の線)と四分位範囲=IQR(箱の幅)により、安定性やばらつきの違いを直観的に把握できます。

実務での読み取りポイントは次のとおりです:

中央線(中央値):典型的な水準。上下に動けば“全体の底上げ/低下”。

箱の幅(IQR):安定性の指標。狭い=安定、広い=変動が大きい。

ひげの長さ・左右差:分布の偏り(歪み)。右が長い=右に歪む、左が長い=左に歪む。

外れ値の有無:エラーか偶発か成功・失敗の兆しかを切り分け、原因を深掘り。

分析をより確かなものにする運用上のコツ:

■ サンプル数(n)を必ず併記し、少数データの解釈に注意する。

■ 時系列やセグメントごとに並べて、箱ひげ図を“横に比較”する。

■ 同一スケール(同じ縦軸)で並べ、中央値・IQRの数値も注記する。

■ 外れ値処理(除外・ウィンズライジング等)は目的と基準を明記して再現性を担保。

なお、箱ひげ図はヒストグラムや折れ線(時系列)と併用すると、分布の形や季節性・トレンドまで見通せます。まずはヒストグラムで形を確認し、箱ひげ図でグループ比較、必要に応じて時系列で推移を押さえる――この三点セットが実務では有効です。

次回は「散布図」を取り上げ、2つの指標の関係性を“見える化”します。相関と因果の違い、外れ値の影響、トレンド線の読み方まで、ビジネス活用の勘所をやさしく整理します。

<文/綱島佑介>

新着記事

同じカテゴリーの新着記事

同じカテゴリーの人気記事

CONTACTお問い合わせ

個別講義や集団講義、また法人・団体向けの研修を行うスペース紹介です。遠人に在住の方や自宅で講義を受けたい方はオンライン講座をご用意しております。よくある質問はこちら