マスログ

2020/11/23

知っておきたい統計学の豆知識第2弾~平均の平均は平均じゃない?~


こんにちは。和からの数学講師の岡本です。今回は「知っておきたい統計学の豆知識」シリーズ第2弾として、「平均の平均」についてお話していきます。前回の記事はこちらからご覧いただけます。

知っておきたい統計学の豆知識~平均を表す“(mu)”について~

1.平均の平均

早速ですが、次の状況を考えてみましょう。

ある高校で定期テストが行われました。結果、各クラスの平均点はA組が65点、B組が70点、そしてC組が57点でした。

このとき、A~C組全体の平均点は

\begin{align*}
\frac{65+70+57}{3}=\frac{192}{3}=64
\end{align*}

と考えてもいいでしょうか?上の式から分かるように、3クラスの平均点を全て足し上げ、クラスの数(3)で割るという計算をしています。これは果たして、全クラスの平均点と一致するのでしょうか?

2.結論

結論をいうと、一致しません。つまり、「平均の平均は平均」ではありません。正確にいうと、必ずしも「平均の平均は平均」になるとは限らないのです。その原因は各クラスの人数比にあります。例えば、A組は40人、B組は60人、C組は50人だったとしましょう。このとき、全員分の総得点は、各クラスの平均点\(\times\)人数の和として計算できます。

\begin{align*}
65\times 40 +70\times 60 +57\times 50=2600+4200+2850=9650
\end{align*}

また、A~C組の生徒の総人数は\(40+60+50=150\)人であることから、全体の平均点は

\begin{align*}
\frac{\text{総得点}}{\text{総人数}}=\frac{9650}{150}=64.333…
\end{align*}

となり、先ほどの数値と若干ズレています。もっと極端な例を考えましょう。例えば、A組の人数が10人、B組が40人、C組が400人だったとしましょう(成績順でクラス分けされている予備校や学習塾では十分あり得るシチュエーションです)。このときの全体の平均は先ほどと同様に計算をすると

\begin{align*}
\frac{65\times 10+70\times 40+57\times 400}{10+40+400}=\frac{26250}{450}=58.333…
\end{align*}

となります。やはり、最初の「64点」と異なる結果になりました。なおこの結果は400人という数字が強く影響を及ぼし、このクラスの平均57に引っ張られています。

3.加重平均

「平均」にもいくつか種類があります。ここでは重要度(重み)を加味した平均である「加重平均」について簡単に説明します。
3つのデータ\(x_1, x_2, x_3\)があります。このまま単純に平均値を計算すると

\begin{align*}
\bar{x}=\frac{x_1+x_2+x_3}{3}
\end{align*}

となります。しかし、実はこのデータには重要度という概念があり、それぞれ数値で\(a_1, a_2, a_3\)と表せるとします。単純な平均では、この重要度を度外視し、全体をならしているのに対して、加重平均\(\hat{x}\)は以下のように定めます。

\begin{align*}
\hat{x}:=\frac{a_1x_1+a_2x_2+a_3x_3}{a_1+a_2+a_3}
\end{align*}

みなさん、お気づきでしょうか。実は、先ほどクラスの人数を加味して計算したのは、重要度をクラスの人数とした平均点の加重平均に他なりません。平均を計算する時点で計算に用いたデータの大きさの情報が現れます。単純な「平均の平均」ではその情報が加味されないので、全体の平均値を求めることができません。ただし、重要度(あるいは各平均値の計算に用いたデータ数)が同じであるとき、その加重平均は

\begin{align*}
\frac{Ax_1+Ax_2+Ax_3}{A+A+A}=\frac{A(x_1+x_2+x_3)}{A(1+1+1)}=\frac{x_1+x_2+x_3}{3}
\end{align*}

となり、単純な平均と一致します。一般には重み(データ数)が一致するとは限らないので、「平均の平均」は平均には必ずしもなり得ないのです。

4.さいごに

いかがでしたでしょうか?「平均の平均は平均」のように思ってしまいがちですが、正確には違うということを今回説明しました。このような、平均というものの扱い1つで、データのとらえ方や扱い方が変わってきます。そして今後ますますこのようなデータ分析能力の必要性は高まります。そのため統計学を「知っている」か「知らない」かの差もますます大きくなると予測されます。和からでは初めて統計学を学ぶ、あるいはハードルが高くてなかな勉強が進まないという方のために、「統計超入門セミナー」を開催しております。「そもそもデータ分析ってなに?」「統計学って本当に必要なの?」といった、疑問にもお答えします!

文系のための「統計超入門セミナー」-目で見てわかるビジネス統計学-

難しい数式も使わず、まずはイメージで統計を理解するのにこれ以上ないほどオススメのセミナーとなっております!

●和からのセミナー一覧はこちら
●お問い合わせフォームはこちら

<文/岡本健太郎>