今更聞けない「誤差」の違いー過誤、系統誤差、偶然誤差ー
公開日
2021年9月19日
更新日
2021年9月19日
データの分析を行う際、気になるのが集めたデータが持つ「誤差」。皆さんは誤差にいくつかの種類があることをご存知でしょうか?
誤差は大きく分けて3種類あり、それぞれ過誤、系統誤差、偶然誤差と呼びます。今回はサッカーのリフティング(ボールが落ちないように蹴り上げ続けること)の回数を毎日集計する場合から、違いを考えみましょう。
この記事の主な内容
過誤とは?
過誤とは、記録のミスがあった場合や測定方法を誤ってしまった場合など、基本的に測定者のミスによって生まれる誤差です。例えばリフティングに夢中で途中で数えるのを忘れてしまったり、数えるのを頼んだ友達がよそ見をしていたりすることによって生じます。
系統誤差とは?
系統誤差は、誤差を生む要因が説明できるものを指します。例えば、雨の日はボールが滑ったり、風が強い日はボールが流されたりするためリフティングは難しいです。お母さんにカウントを頼めば気をつかって多めに数えてくれるかもしれないですし、ライバルの友達に頼むとかなり厳しく見られるでしょう。他にも時間帯、場所、精神状態など色々な誤差が考えられます。
偶然誤差とは?
偶然誤差は、原因がはっきりせず、過誤や系統誤差を取り除いても説明できない誤差を指します。仮に状況が全く同じでも、よりたくさんリフティングができることもあれば、逆に続かない場合もあります。日常生活では運不運で片付けられることもありますが、統計学ではランダムに発生する誤差として考えます。
誤差の扱い方
データを集める際には、上記の誤差を考慮する必要があります。過誤や系統誤差を取り除いて、繰り返しデータを集めて偶然誤差の大きさを調べることで、正しく推定を行うことができます。どのような分析を行うかも当然重要ですが、その前提となるデータの集め方も分析結果を大きく左右します。「フィッシャーの3原則」と呼ばれるデータ収集を行う際に従うべき指針がありますので、興味を持った方は調べてみると良いでしょう。
和からでは、統計学を初めて学ぶ方やより高度な内容を学びたい方に向けて講義を行っております。無料のセミナーも随時開催しておりますので、ぜひお気軽にご参加ください!
それではまた。
<文/岡崎 凌>
⇒ 講師紹介ページへ