やさしく学ぶ統計学~いろいろなデータの可視化~
公開日
2023年1月4日
更新日
2023年1月4日
みなさんこんにちは。和からの数学講師の伊藤です。これまでのマスログではいろいろなデータの可視化を学んできましたが、これまで触れてこなかったもの以外にも、有用なグラフがいくつかあります。
今回はデータの可視化の応用として、2つ以上の変数を持つデータの可視化するバブルチャートと、データのバランスを見るレーダーチャートを扱っていきます。
この記事の主な内容
1. 3変数以上のデータの可視化
以前は散布図による可視化や、相関係数という指標を使った2変数のデータの関係性を見てきましたが、3つ以上の変数が存在する場合にもデータの可視化を行うことが可能です。よく使われるグラフとして、バブルチャートと呼ばれるものがあります。次のようなデータを考えてみましょう。
ある飲食店の売り上げ、来客数、最高気温の3つの数値がデータとなっています。このような場合、次のようなグラフを用いてデータを可視化できます。
これは、売り上げと来客数については通常通り散布図を描き、最高気温の情報をそれぞれの円の半径として表現したものです。散布図としての傾向のほかに、右上にあるデータほど円が大きい傾向も見て取れるので、気温が高い日ほど売り上げ、来店者数も高い傾向が見て取れます。
他にも、円に色を塗るなどの工夫をすることで、質的変数の情報を加えて4変数以上のデータを可視化することにも応用ができます。
2. レーダーチャート
レーダーチャートは、データを多角形で表現することで、そのデータのバランスを可視化することができます。次のようなデータを見てみましょう。
ある飲食店の1か月間におけるスパゲッティーメニューの売り上げデータです。これをレーダーチャートで表現すると以下のようになります。
たらこスパゲッティーとカルボナーラは売り上げが高い水準にありますが、キノコのスパゲッティーは比較的売り上げが低い水準にあります。では一方、他の店舗の売り上げを見てみると、以下のようになっています。
どの商品も均等に売り上げがあり、バランスが良いと言えます。なお、レーダーチャートは、折れ線グラフと同じように複数のデータを重ねて表示することに適しています。
これにより、複数店舗の比較などに利用できるのもレーダーチャートの強みと言えるでしょう。
3. レーダーチャートの注意点
レーダーチャートを使用する際に、以下のようなグラフを作ると読み手に誤解を与えてしまう恐れがあります。
ひとつの項目だけ単位が違っており、グラフの見た目が大きく異なっています。このようなグラフを作ってしまうと印象操作に繋がる場合もあるので、単位が異なるデータどうしを比較することは望ましくありません。レーダーチャートを作成する際は、単位が揃っていることをしっかりと確認するようにしましょう。
●和からのセミナー案内
和からではデータ分析に関するセミナーを多数用意しています。興味のある方は是非一度無料講座へお越しください。
●和からのセミナー一覧はこちら
●お問い合わせフォームはこちら
<文/伊藤智也>