時系列分析とは何か?時系列データの構造と主な分析方法であるARMAモデル、ARIMAモデル、状態空間モデルについて解説

2023年6月23日

時系列分析とは

経済指標、気象データ、株価など、時間に沿って観測されるデータは時系列データと呼ばれます。
時系列分析とは、時系列データをを分析して時間的な変動やパターンを解析し、未来の予測やトレンドを把握するための手法です。

時系列分析はビジネスにおいて幅広い分野で応用され、意思決定のサポートや戦略策定に役立てられています。

時系列データの構造

時系列モデルを作成するためには、時系列データのデータ構造を知る必要があります。
典型的な時系列データが持っている特徴や構造について解説します。

自己相関

自己相関とは、同一のデータ間で過去と未来の相関をとったものです。
過去の時点と現在の時点との間の相関関係を評価することで、データの周期性やパターンを把握するのに役立ちます。
「昨日の気温が高ければ今日も高い」といった傾向がある場合は、正の自己相関があるといえます。

コレログラムという自己相関を表現するグラフを用いることで、相関の強さや周期性を確認することができます。

自己相関は、後述するARIMAモデルなどの時系列予測手法において重要な要素であり、時系列データの特性を理解する上で欠かせない概念です。

季節成分・周期性

季節成分周期性は、データに季節的なパターンや周期性が現れる場合に考慮する必要があります。

平均気温のデータなどを分析した際に、12ヶ月前と強い相関が見られたとします。
このような年単位の周期性は「季節性」または「季節成分」と呼ばれます。

また、遊園地の来場者数のデータを分析した際に「毎週土曜・日曜に混雑する」といった傾向がある場合は「周期性がある」といえます。

季節成分や周期性は、自己相関の一種と捉えることができますが、「昨日と今日が似ている」と「毎週土曜は似ている」を分けて考えることで精度の良いモデルを構築することができます。

トレンド

トレンドとは、データの長期的な変動傾向や方向性を指します。
製品の売れ行きが好調で、毎月売上額が右肩上がりのような状態のことを「正のトレンドがある」といいます。

トレンドに一定の形が見られる場合には、簡単な予測を行うことも可能です。

外因性

外因性とは、時系列データの変動に影響を与える外部要因や要素を指します。

トレンドや季節性とは異なり、自然災害、経済変動、イベントの開催などの突発的で予測のできない事象が観測された場合のデータです。
「近くでお祭りがあったので飲み物がいつもより売れた」という状況が起きた場合には、外因性要因があったといえます。

現実問題において、外因性要因の特定やモデル化は困難であり、時系列分析では経験的なアプローチや統計手法が用いられます。

ホワイトノイズ

未来を予測する上で利用できる情報をほどんど含んでいないノイズをホワイトノイズといいます。

ホワイトノイズの要件は「期待値0」「均一な分散」「自己相関が0」です。
時系列分析による予測において、予測できない確率的な変動を表現する際に重要な役割を持ちます。

時系列分析モデル

時系列データ分析には様々な種類のモデルが存在ます。
中でも代表的な「ARMAモデル」「ARIMAモデル」と、発展的な「状態空間モデル」を紹介します。

ARMAモデル

観測値が一定の幅で上下し、自己相関の関係性も一定である時系列データを「定常性を持つデータ」といいます。定常性を持つデータは非常に分析しやすく、特にARMAモデルでは高い説明力を持ちます。

ARMAモデルは、自己回帰移動平均モデル(Autoregressive Moving Average Model)の略で、ARモデル(Autoregressive Model)とMAモデル(Moving Average Model)を組み合わせたモデルです。

自己相関を表現する際に、ARモデルは「過去の自分のデータ」を説明変数として使用し、MAモデルでは「過去と未来で共通の値」を使用します。
ARMAモデルはこれらを組み合わせ、自己相関を柔軟に表現することができます。

ARIMAモデル

データが定常性を持たない場合にはARMAモデルをそのまま使用することができません。
そこで、データ間であらかじめ和分をとった上でARMAモデルを利用します。
これをARIMAモデル(自己回帰和分移動平均モデル/Autoregressive Integrated Moving Average Model)といいます。

ARIMAモデルでは、ARMAモデルにさらに差分操作を追加したことで、非定常な時系列データの分析が可能となりました。

状態空間モデル

状態空間モデルは、観測できない状態変数と観測変数の関係を表現する時系列モデルです。

たとえば、毎日同じ湖で釣りをして釣果を記録していた場合、その記録は「日毎の釣れた魚の量」という時系列データとなります。
しかし、日毎の釣果の多い少ないから湖全体の魚の量を予測することはできません。
暑さで魚の食いつきが悪い日、たまたまたくさん釣れた日といった「観測誤差」が発生します。

状態空間モデルでは、「湖の魚の数」を観測できない状態として状態方程式で表現し、観測方程式によって観測誤差などを加味して予測を行います。
状態空間モデルには、人間の直感や知見をモデル化できるというメリットがあります。

参考

書籍

  • 馬場 真哉『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』プレアデス出版、2018年
  • 杉山 聡『本質を捉えたデータ分析のための分析モデル入門 』ソシム、2022年

Webページ

  • http://www.mi.u-tokyo.ac.jp/consortium2/pdf/4-4_literacy_level_note.pdf(2023年6月19日確認)
  • https://logics-of-blue.com/%E6%99%82%E7%B3%BB%E5%88%97%E8%A7%A3%E6%9E%90_%E3%83%9B%E3%83%AF%E3%82%A4%E3%83%88%E3%83%8E%E3%82%A4%E3%82%BA%E3%81%A8%E3%83%A9%E3%83%B3%E3%83%80%E3%83%A0%E3%82%A6%E3%82%A9%E3%83%BC%E3%82%AF/(2023年6月19日確認)