やさしく学ぶ統計学~クロス集計表の考え方~
公開日
2022年12月21日
更新日
2022年12月21日
みなさんこんにちは。和からの数学講師の伊藤です。今回は、2つのカテゴリーのデータを集計する際に有効なクロス集計表に関するお話です。クロス集計のやり方にはいくつか種類がありますが、考え方が分かっていれば混乱することは少なくなるかと思います。また、実際のデータ分析に応用することも可能ですので、ぜひ習得しておきましょう!
この記事の主な内容
1.クロス集計表とは
今回は、次のようなデータを見ていきましょう。
傘雲と呼ばれる雲がありますが、富士山に傘がかかっていると次の日は雨が降る…という話をよく聞きます。
この話が本当かどうかを検証するために、傘が現れた翌日に雨が降ったかどうかを集計してみましょう。まずは、傘が現れた日の中で、翌日の天気を集計してみましょう。すると、次のようになります。
一方、傘が現れなかった日の中で翌日の天気を集計してみると、次のようになっています。
これだけでも特徴は読み取ることが可能ですが、このデータをクロス集計表にまとめることで、より集計結果を見やすく工夫できます。クロス集計表は、2つのカテゴリーのデータを同時に分類して度数を集計したものです。実際に作成してみると、次のようになります。
どうやら傘が現れた日の翌日は、本当に雨が降りやすいようですね!
2. クロス集計表の表し方
今回の例の場合、クロス集計したデータを割合に直すとより見やすくなりそうです。例えば次のように、行に対して集計したクロス集計表を考えてみます。
この場合、「傘雲あり」の行では、傘雲が発生した全87日の中で、それぞれの天候の日数の割合を表しています。「傘雲なし」の行も同様です。また、今回は各行の合計が100%になるようクロス集計表を作成しましたが、列の合計が100%になるよう作成した次のようなクロス集計表を作成することもあります。
さらに、全ての項目を、観測した365日に占める割合で表現した集計表も見られます。
これはすべての項目を合計すると100%になるように作られています。クロス集計表の基準をどこに設定するかによって伝わりやすさも変わってくるかと思いますので、作成の際には注意しましょう。
3. クロス集計表の応用
データ分析の手法の中には、クロス集計表に基づいた統計手法が存在しています。よく目にするのは、カイ二乗検定や分散分析などといった内容です。これらの手法は統計検定2級範囲でよく出題されています。また、統計検定3級範囲でもクロス集計表の読み取りは求められます。今後、これらの集計表を目にした際に混乱しないよう、クロス集計表のパターンを覚えておきましょう!
●和からのセミナー案内
和からではデータ分析に関するセミナーを多数用意しています。興味のある方は是非一度無料講座へお越しください。
●和からのセミナー一覧はこちら
●お問い合わせフォームはこちら
<文/伊藤智也>