見出し画像

第1回 時系列分析~入門編~

はじめに

日々変動する株価、店舗の売上、気温など時間の経過とともに観察されるデータは世の中にたくさんあります。

このようなデータの背後にある理論を見出したり、将来の値を予測するのが時系列分析となります。

今回から複数回にわたって、"時系列分析"に関して記事にまとめていきます。

時系列データとは

時系列分析の説明に入る前に、そもそも時系列データとはどのようなものかについて説明したいと思います。

コトバンクでは、時系列データとは以下のように定義されています。

時間的順序を追って一定間隔ごとに観察され,しかも相互に統計的依存関係が認められるようなデータの系列を時系列,あるいは時系列データという。年度ごとの国民総所得,四半期ごとの輸出入実績,月ごとの失業率,毎日の株価などの経済指標をはじめ,政治,社会,文化などの各分野での多くの基礎統計は時系列といえよう。

出典:時系列データ コトバンク

なお、一定間隔ではない場合は点過程と呼びます。

時系列分析とは

時系列データを解釈するための手法であり、データ系列の背後にある理論を見出したり、将来の予測を行うために用いられます。

例えばコンビニエンスストアの売上に関する時系列分析を行う場合には、そのコンビニエンスストアがある場所(住宅街なのかビジネス街なのか)、競合のお店が近くにあるのか、といったものが背景にあることが考えられます。

これらの情報をもとに時系列モデルを構成し、過去のデータから将来の売上の予測を行います。

時系列分析に必要な前提知識

時系列モデルを扱う上での前提知識について解説します。

ラグ

ある時点を基準としたときの時間のずれをラグ(lag)と呼びます。

コンビニエンスストアの日次売上データの場合、昨日の売上データのことをラグ1の売上データ、k日前の売上データのことをラグkの売上データといいます。

自己相関

統計を勉強したことがある方であれば、相関係数と呼ばれるものを聞いたことがあるのではないでしょうか?自己相関を説明する前に相関係数についておさらいしておきましょう。

相関係数とは2つのデータの間にある線形な関係の強弱を測る指標のことで、-1~1の値を取ります。相関係数が正のときには正の相関が、負のときには負の相関があるといい、相関係数が0のときは無相関であるといいます。

相関係数の違いによって2つのデータの関係は下記のようになります。

画像1

正の相関がある場合は、あるデータの値が大きくなると、もう一方のデータの値も大きくなり、負の相関がある場合は、もう一方のデータの値が小さくなります。

相関係数では、同じ時点の2つのデータの関係を測ります。一方で、1つのデータに対して異なる時点の関係を測る指標が自己相関係数となります。

相関係数と自己相関係数の算出の違いは、下記のようなイメージとなります。

相関係数では、データAとデータBの同じ時点での値の比較をしていますが、自己相関係数では、データAのデータを1時点ずらして値の比較をしています。このように1時点ずらした自身のデータとの相関係数を1次の自己相関係数、k時点ずらした自身のデータとの相関係数をk次の自己相関係数といいます。

画像3

画像3

また、自己相関係数をkの関数としてみたものを自己相関関数といい、自己相関関数をグラフ化したものをコレログラムといいます。

定常、非定常

時間によって平均や自己共分散が変化しない時系列データの性質を定常性といいます。また、定常性を持つ確率過程のことを定常過程と呼びます。定常過程でない確率過程のことを非定常過程と呼びます。

定常過程の説明に入る前にどういった時系列データが定常ではないのか確認してみたいと思います。下記のグラフは、横軸は時刻、縦軸はあるデータの値となっており、下記の特徴があります。

・時間が進むにつれて、データのとる値は上昇傾向にある(時間によって平均は変化する)
・時間が進むにつれて、データのとる値の幅が大きくなっている(時間によって自己共分散は変化する)

画像4

一方で、下記のグラフのように時間によって平均や自己共分散が変化しない時系列データが定常過程となります

画像5

ホワイトノイズ

定常過程のうち、平均が0、分散が一定で自己共分散が0である時系列データをホワイトノイズと呼びます。

実は「定常、非定常」の最後に出てきたグラフはホワイトノイズとなっており、平均が0、分散が1となっています。

多くの時系列モデルでは、確率的な変動をホワイトノイズで仮定しており、時系列分析においては非常に重要な役割を果たしています。

まとめ

・時系列データとは時間的順序を追って一定間隔ごとに観察されたデータのことです
・時系列分析は、データ系列の背後にある理論を見出したり、将来の予測を行うために用いられます
・時系列分析を行う上で、ラグ、自己相関、定常・非定常、ホワイトノイズといった概念を知っておくことが重要となります。

次回予告

次は自己回帰モデルであるARモデルやMAモデルなどについて記事を書きたいと思っています。最後まで読んでいただきありがとうございました。

この記事が気に入ったらサポートをしてみませんか?