データを“見る”統計グラフ-第1回 散らばりと箱ひげ図【統計学をやさしく解説】
公開日
2025年10月12日
更新日
2025年11月25日
この記事の主な内容
はじめに:数値だけでは見えない“ばらつき”を可視化する
前シリーズ「データの散らばりとは?」では、分散や標準偏差を通じて“ばらつき”を数値で理解しました。今回からは、そのばらつきを“見える化”する方法に焦点を当てます。テーマは 箱ひげ図(はこひげず)。一見すると難しそうですが、実はデータの特徴を一目で理解できる非常に便利なグラフです。

箱ひげ図とは?:データを「箱」と「ひげ」で表す
箱ひげ図(Box-and-Whisker Plot)は、データの散らばりを視覚的に表現するグラフです。特徴は、データ全体を「四分位数」という4つの区間に分けて表示する点にあります。
箱ひげ図の基本構成は次の通りです:
■ 箱の中央線:中央値(データの真ん中の値)
■ 箱の両端:第1四分位数(Q1)と第3四分位数(Q3)
■ ひげ(線の部分):データの範囲(外れ値を除く)
■ 点:外れ値(極端に離れた値)

四分位数をやさしく理解する
「四分位数」という言葉を聞くと難しそうですが、考え方はとてもシンプルです。データを小さい順に並べて、全体を4等分したときの区切りを指します。
■ 第1四分位数(Q1):下位25%の境目(データの下側の中心)
■ 第2四分位数(Q2)=中央値:全体の真ん中
■ 第3四分位数(Q3):上位25%の境目(データの上側の中心)
これらをつなぐと、データの「中心」と「広がり」を同時に把握できます。

箱ひげ図から読み取れる3つのポイント
箱ひげ図を見れば、次のような情報が一目でわかります:
■ データの中心:箱の真ん中にある線(中央値)で把握
■ ばらつきの大きさ:箱の幅が広いほど、データの散らばりが大きい
■ 偏り(歪み):箱の中心線が左寄りなら「右に歪む」、右寄りなら「左に歪む」
このように、箱ひげ図は「分布の形」を直感的に見せてくれるグラフです。たとえば、営業チームの売上データを比較すれば、「どのチームが安定しているか」「外れ値(突出した営業成績)があるか」も一目で判断できます。

外れ値(Outlier)とは?:平均では見えない重要な存在
外れ値とは、他のデータから大きく離れた値のことです。多くの場合、ひげの範囲を超えて点として描かれます。
外れ値は「ノイズ(誤差)」であることもあれば、「重要なシグナル」である場合もあります。たとえば、ある月の売上が異常に高かったとき、それが偶然か成功施策の結果かを見極めることが、ビジネス判断の鍵になります。

ビジネスでの活用例
箱ひげ図は、ただのグラフではなく、ビジネスに活かせる強力な分析手法とも考えられます。次のような使い方ができます。
営業成績の比較
チームごとの売上分布を比較し、平均だけでなく「安定性」や「成果のばらつき」を把握する。
顧客満足度の分析
アンケート結果を箱ひげ図で可視化することで、満足度のばらつきや不満層の有無を確認できる。
広告キャンペーンの評価
クリック率や獲得単価などのデータを箱ひげ図で比較し、成果が安定しているかを評価する。

まとめ:箱ひげ図は“データの個性”を見抜くレンズ
箱ひげ図は、平均や標準偏差だけでは見抜けない「データの全体像(中心・広がり・偏り・外れ値)」を、ひと目で比較できる強力なツールです。特にビジネスでは、チーム・店舗・期間・施策など複数グループの成績を公平に見比べるのに向いており、外れ値に引っ張られにくい中央値(箱中央の線)と四分位範囲=IQR(箱の幅)により、安定性やばらつきの違いを直観的に把握できます。
実務での読み取りポイントは次のとおりです:
■ 中央線(中央値):典型的な水準。上下に動けば“全体の底上げ/低下”。
■ 箱の幅(IQR):安定性の指標。狭い=安定、広い=変動が大きい。
■ ひげの長さ・左右差:分布の偏り(歪み)。右が長い=右に歪む、左が長い=左に歪む。
■ 外れ値の有無:エラーか偶発か成功・失敗の兆しかを切り分け、原因を深掘り。
分析をより確かなものにする運用上のコツ:
■ サンプル数(n)を必ず併記し、少数データの解釈に注意する。
■ 時系列やセグメントごとに並べて、箱ひげ図を“横に比較”する。
■ 同一スケール(同じ縦軸)で並べ、中央値・IQRの数値も注記する。
■ 外れ値処理(除外・ウィンズライジング等)は目的と基準を明記して再現性を担保。
なお、箱ひげ図はヒストグラムや折れ線(時系列)と併用すると、分布の形や季節性・トレンドまで見通せます。まずはヒストグラムで形を確認し、箱ひげ図でグループ比較、必要に応じて時系列で推移を押さえる――この三点セットが実務では有効です。
次回は「散布図」を取り上げ、2つの指標の関係性を“見える化”します。相関と因果の違い、外れ値の影響、トレンド線の読み方まで、ビジネス活用の勘所をやさしく整理します。
<文/綱島佑介>





