マスログ

ヒストグラムの「正解」はどこにある?理論と現場のリアルな最適解

公開日

2025年12月10日

更新日

2026年1月5日


 みなさんこんにちは!和からの数学講師の岡本です。普段、データ分析や統計学の講座を担当していると、受講生の方から非常によくいただく質問があります。それが、「ヒストグラムの階級幅(棒の太さ)はどのように決めればいいのですか?」という質問です。

ヒストグラムはデータの分布を可視化する基本のグラフですが、この「区切り方」一つで印象がガラリと変わってしまうため、悩まれる方が多いようです。今回は、この階級幅の決定について、理論と実践の両面から解説します。

1.理論的な正解?「スタージェスの公式」とは

統計学の教科書や理論的なアプローチとして、よく紹介されるのが「スタージェスの公式」です。これは、データ数\(n\)に対して、最適な階級数\(k\)(柱の本数)を求めるための公式で、以下のように表されます。

\begin{align*}
k = 1 + \log_2 n
\end{align*}

ここで\(\log_2 n\)は対数関数で、「2を何乗すればデータ数\(n\)になるか」を表しています。ざっくり言うと、「データ数が増えれば階級数も増やすべきだが、その増やし方は緩やかでいい」ということを示しています。
例えば、データ数が\(n=100\)の場合、\(\log_2 100 \approx 6.64\)なので、\(k \approx 1 + 6.64 = 7.64\)となり、階級数は大体8個くらいが適切だ、という目安を与えてくれます。

2.実務ではスタージェスの公式を使わない理由

「じゃあ、常にこの公式を使えばいいの?」と思われるかもしれませんが、実務の現場では、スタージェスの公式を厳密に使うことはあまりありません。なぜでしょうか?最大の理由は、この公式が「元のデータが正規分布(きれいな山型)であること」を前提としているためです。

実際のビジネスデータや観測データは、山が二つあったり、左右に極端に歪んでいたりと、綺麗な正規分布をしていないことが多々あります。そのようなデータに対してスタージェスの公式を適用すると、特徴をうまく捉えきれず、逆に分布の形をミスリードしてしまうことがあるのです。

3.結局どうすればいい?

では、実際にはどういう判断で階級幅を決めているのでしょうか?私のおすすめは、「まずはビンの個数(階級数)が10前後になるように設定してみる」というアプローチです。

10個程度に分割してみて、データの山が潰れすぎているなら数を増やし、逆にスカスカで歯抜けになっているなら数を減らす。このように、実際にグラフを見ながら微調整(試行錯誤)するのが最も確実です。

4.さいごに:データの可視化に「絶対の正解」はない

データの可視化において最も重要なのは、「データの内容や特徴を、いかにわかりやすく相手に伝えるか」です。

そのため、階級幅の決定に絶対的な正解はありません。分析者が「この幅が一番データの特徴を表している!」と確信を持って説明できるのであれば、それが正解なのです。公式にとらわれず、「わかりやすさ」を最優先にグラフを作ってみてください。

和からのセミナーで、データ分析の基礎を固めよう!

和からでは、こうしたグラフの作り方から統計学の基礎までを学習できる無料セミナーや、動画配信サービス「ハビット」をご用意しています。ご自身のペースで学びたい方は、ぜひチェックしてみてください。

▼初学者向けの統計学の超入門講座(無料!)▼

文系のための「統計超入門セミナー」-目で見てわかるビジネス統計学-

▼データ分析・統計学の基礎が学べる動画サービス「ハビット」▼

動画視聴サービス「ハビット」


 

▼大人が数学を楽しみながら再学習するために…無料セミナーのお申し込みはこちら▼

【これが本当の楽しみ方】大人のための数学再学習ガイド-大人だからこそ理解できる数学の面白さ-


 

▶ 和からのセミナー一覧:こちら
▶ お問い合わせフォーム:こちら(オンライン個別レッスンも受付中!)

 

▶ 数学とアートが融合した岡本の著書です:
アートで魅せる数学の世界 岡本健太郎(著) 技術評論社

 

<文/ 岡本健太郎>

新着記事

同じカテゴリーの新着記事

同じカテゴリーの人気記事

CONTACTお問い合わせ

個別講義や集団講義、また法人・団体向けの研修を行うスペース紹介です。遠人に在住の方や自宅で講義を受けたい方はオンライン講座をご用意しております。よくある質問はこちら