やさしく学ぶ統計学~平均値と中央値~
公開日
2022年11月3日
更新日
2022年11月3日
↓↓↓動画で見たい方はこちら↓↓↓
みなさんこんにちは。和からの数学講師の伊藤です。今回は、データを要約することでその特徴を表すことができる、代表値についてのお話です。グラフを描くことの他に、この代表値を使ってデータの特徴を把握する機会は多いです。基本的な代表値を使いこなして、データ分析への理解を深めましょう。
この記事の主な内容
1. 平均値
平均値は私たちの生活ともなじみ深いものですが、どういった指標かおさらいしていきましょう。計算方法としては、全てのデータを足して、データの数で割るといったものになります。
「平」らに「均(なら)」すという意味を持っていますが、平均よりも「多い分」と「少ない分」を足し引きするとちょうど0になるという意味で、データの「真ん中」を表している指標と言えます。
今回はこのようなデータを考えましょう。ある都市の1週間の最高気温のデータです。7日分のデータを足すと130.9℃となります。したがって平均値は、これを7で割ることで18.7℃と計算できます。テストの点数や気温など、日常ではこの平均という指標を非常によく目にします。
2. 中央値
平均値は、データの真ん中を表す指標として有名です。しかし、「真ん中」と呼べる指標は平均値以外にも存在します。その一つが中央値と呼ばれる指標です。
先ほどの気温のデータの「真ん中」は何かと聞かれた際に、平均の18.7℃と答える方もいれば、16.5℃と答える方もいるかと思います。
中央値というのが、まさにこの16.5℃という考え方です。つまり、データを小さい順に並べ替えて、順序的な「真ん中」に当たる点が中央値です。
ちなみに今回はデータ数が7個と奇数だったので「真ん中」が一つに定まりましたが、データが偶数個の場合は、「真ん中」といえるデータが2つあります。この場合、中央値は「真ん中」の2つのデータの平均値になります。
3. 平均値と中央値はどちらも必要?
どちらもデータの「真ん中」を表している平均値と中央値ですが、片方を知っておけば問題ないかというと、そんなことはありません。
平均値は便利な指標ではありますが、たとえばデータの中に極端な値が含まれている場合には、うまく機能しないことがあります。一方中央値は、データの順序にしか着目していないため、平均値に比べて反映される情報が少なく、データの規模や分布を捉えることはできません。
データ分析をする際には、どちらの値も考察する必要があるという点は覚えておきましょう。平均値と中央値の両方の値を見ることで、データに歪みがあることに気付いたり、「真ん中」を正しく解釈したりすることに繋がっていきます。
●和からのセミナー案内
和からではデータ分析に関するセミナーを多数用意しています。興味のある方は是非一度無料講座へお越しください。