見出し画像

時系列データの読み方

数学ⅠやBで扱われていないけれど、データを扱う上で重要な考え方である時系列データの読み方を簡単に解説します。数学Ⅰと情報Ⅰの棲み分けとして、このあたりが狙われるのじゃないかなって思っています。

時系列分析

時間とともに変化するデータの系列を分析します。
傾向変動(トレンド)、季節変動(シーズン)、循環変動(サイクル)、不規則変動(ノイズ)の4つに分解でき、これらの和や積としてモデル化されます。
傾向変動は成長している・衰退しているなどの大きな流れのことです。
季節変動は1年単位、1週単位で見られる周期的な変動です。
循環変動は景気など、季節変動以外の周期的な変動のことです。
不規則変動は上記以外のものです。不規則変動が大きい部分では突発的な理由が考えられます。

今回は、積でモデル化される場合を考えていきます。
4つの傾向のうちからいくつかを数学的な計算で取り出す方法を解説します。

移動平均(傾向変動×循環変動)

新型コロナウイルスが流行りだした頃、罹患者数がテレビなどで報道されました。
このとき、検査を受ける人数は曜日によって大きな差があることがわかりました。土曜日や日曜日は医療機関が休みのため少なく、その反動で月曜日に検査数が増えていました。
つまり、1週間単位での季節変動が顕著に見られたのです。
この状況の中では、1日ごとの罹患者数だけに注目すると、コロナも土日に休んでいるという誤った読み取りになってしまいます。
そこで、季節変動の影響を少なくするために、移動平均を取ることにしました。
移動平均とは、ターゲットとなる日が中心となるようにして、周期に合わせた平均を取る手法です。

1週間(7日:奇数)
月曜から日曜の平均  ⇒ 木曜の移動平均の値
火曜から翌月曜の平均 ⇒ 金曜の移動平均の値
……とします。


1年単位(12ヶ月:偶数)
(1月~12月の平均)と(2月~翌1月の平均)の平均 ⇒ 7月の移動平均の値
(2月~翌1月の平均)と(3月~翌2月の平均)の平均 ⇒ 8月の移動平均の値
……とします。
1年は12ヶ月で偶数ですので、7月が中心となるように移動平均を取ることができません。そこで、1月~12月の平均(6.5月の移動平均の値)と2月~翌1月の平均(7.5月の移動平均の値)を平均して、7月の移動平均の値とします。
これを中心化移動平均といいます。

季節変動の影響を取り除く。

2つ目は季節変動だけをピンポイントで取り除く方法です。
少しややこしいですが、時系列データは4つの傾向の積になっているというところに注目して、処理をしていきます。

原データ=傾向変動×季節変動×循環変動×不規則変動 ・・・ ①
移動平均=傾向変動×循環変動 ・・・②
①÷②=季節変動×不規則変動 ・・・③
③の月ごとの平均=季節変動 ・・・④
対応月ごとに①÷④=傾向変動×循環変動×不規則変動 (季節調整済みデータ)

具体例:1世帯当たりの支出金額

総務省が公開している1世帯あたりの月別支出金額を使って、移動平均と季節用済みデータの有用性を紹介します。

2017年1月から2022年12月の支出金額をグラフ化すると以下のようになります。

このデータからは顕著な季節変動が見て取れます。
具体的には12月の支出が多く、2月の支出は少ないようです。
12月の支出が多くなることは経験的にも理解できることです。2月はそもそも日数が少ないので通常の月より1割程度減って当然のように思います。

大きな流れ(傾向変動×循環変動)を見るために、移動平均を取ってみましょう。

移動平均を見ると、2020年で全体的に支出が落ち込み、2022年ごろには回復するという傾向が見て取れます。
これは、元のデータを見ていただけではすぐには気が付かないことでした。
しかし、移動平均を見れば一目瞭然です。
2019年末から始まった新型コロナウイルス感染症の影響が見て取れます。
しかし、移動平均は1年間の平均であるため、そこに含まれている情報量が大きく減ってしまっています(モデルとしては不規則変動の影響が見えなくなっている)。
そこで季節変動だけを抑えた季節調整済みデータを作成してみました。

どうでしょうか。
2月の支出は毎年落ちこみますが、その影響を除いても、2020年の2月の支出が少なかったということがわかります。

2000年1月から2022年12月のデータです。

同じように季節調整済みデータを作りました。

2014年3月と2019年9月で季節の動きとは別の変動が見て取れます。
これは消費税増税に関わるものでしょう(不規則変動)。
また、上でも見た通り、2020年初頭の極端な下がり方もわかります。

系列データは、傾向変動、季節変動、循環変動、不規則変動の和や積でモデル化されます。
それらのデータ全体を見ていては、大切な情報を見落としてしまうかもしれません。
そこで、数学的な処理(移動平均や季節調整)を行うことで、注目するべき情報だけを取り出して観察することができます。
このことを知っているだけでも、データの取扱が上手になると思います。


最後までお読みいただきありがとうございます。「スキ」をしていただけるととても励みになります。