時系列データの見方【統計学をやさしく解説】
公開日
2022年11月19日
更新日
2022年11月19日
↓↓↓動画で見たい方はこちら↓↓↓
この記事の主な内容
時系列データとは
時系列データとは、特定の対象を複数地点にわたって観察したデータです。例えば、ある企業の売上を2010年から2020年まで並べたようなデータです。時系列データは主に経済学やファイナンスの分野で利用され、他の分野にない特徴があり特殊な分析手法が必要です。時系列データには単一の対象を複数時点において観察する通常の時系列データと複数の対象について複数時点で観察するパネルデータが存在します。パネルデータの具体例としては、1ヵ月ごとの世界各国のコロナウィルス感染者数の推移などが挙げられます。この記事では、時系列データを分析する基本的な方法を紹介し、時系列データを分析に用いる方法について解説します。
時系列データの特徴
時系列データの特徴として、様々な要因による変動が考えられることが挙げられます。これらの変動は代表的に傾向変動・循環変動・季節変動・不規則変動と分類されます。中でも最も身近な変動が季節変動でしょう。季節変動とは、時系列データの観察対象自体の特徴でなく季節的な条件によって生まれる変動のことです。例えば、コートの売上の時系列データを見た時、10月~2月までは売上が順調であるもののその後春や夏といった季節になって売上が落ち込むことは容易に想像できます。また、家計の消費額が各月で異なるのも季節変動による影響が大きいと言えます。統計学では、季節相関の影響をなくすため前年同期比の利用や移動平均を用いています。また、過去の時点のデータが今後の時点のデータに影響を与えることも考えられます。この影響のことを自己相関と呼び、統計学ではARIMAモデル等を用いて対処されます。
移動平均の考え方
移動平均は季節変動を取り除くためのアプローチとして有用です。12ヵ月の移動平均の計算方法は以下のようになります。
移動平均:\(Y(t)=\frac{1}{12}\Sigma^t_{i=t-11} M(i)\)
ここでは、\(Y(t)\)を\(t\)時点での移動平均の値、\(M(t)\)を月別のデータの\(t\)時点での値としています。移動平均は上に示したように、\(t-11\)時点のデータから\(t\)時点のデータを平均した値です。2022年11月時点の移動平均であれば、2021年12月から2022年11月のデータを平均して求めます。このようにして移動平均を計算すると、どの時点の移動平均も1~12月のデータの値を含むため、季節変動を除去することができます。また不規則で予想のつかない短期間の変動である不規則変動に対しても多数のデータを平均することによって軽減されます。
最後に、移動平均を計算することで傾向変動・循環変動の有無を確認できます。傾向変動とは上昇または加工などのトレンドを持続する長期的な変動のことです。また、循環変動はトレンドと並行して発生する変動です。例としては、好況・後退・不況・回復を循環する景気変動が挙げられます。移動平均の値が上昇/下降していれば上昇/下降の方向性があると分かります。この方向性について、傾向変動もしくは循環変動のいずれかの原因が考えられます。
まとめ
この記事では、時系列データの定義と時系列データの傾向のパターンを読み取るための方法である移動平均について確認しました。時系列データを分析する際には分析対象について定性的な分析を行うことが重要です。例えば、2000年代のデータであれば、ドットコムバブル・リーマンショック・コロナショックの影響を考える必要があります。また、タバコの購買額であれば、下降トレンドや増税の影響が考えられますが、季節変動は少ないでしょう。
●お問い合わせフォームはこちら
<文/須藤>