見出し画像

時系列データをpython【#2.2】ARモデル

以下の本から時系列データの部分を勉強しましたので、少しここに書こうと思います。※アフェリエイトはしていません。でもこの本はすごくいい本なので、これで知識を増やす、勉強するのはいいことだと思います。(アフェリエイトではなく、自分の一生ものの能力をつけるために約3000円でこの本を買って、月給3000円上げようというモチベーションです。)

今回は、第7章のあたりをやっていきます。
前回航空機乗客数のトレンドを書いたので、それに対して、AR・ARMA・ARIMA・SARIMAモデルを適用してみようと思います。

ARモデル(Autoregressive model)
 自己回帰の関係性を記述
ARMAモデル(Autoregressive moving average model)
 移動平均の項かを追加
ARIMAモデル(Autoregressive integrative moving average model)
 トレンドの効果を追加
SARIMAモデル(Seasonal autoregressive integrative moving average model)
 周期(季節)効果を追加

だそうです。数式のあたりも気になりますが、いったんどんな違いが出るかみてみようと思います。何も考えずに、google colab付属の生成AIで「ARモデルを使うってどういうことか」を見てみます(何も考えていない)。

航空機乗客数のトレンド
バグを出しつつ、エラー修正もgoogle colabに依頼して作ったコード

その結果が↓です。なにかよくわかりませんが予測をしているようです。

航空機乗客数のトレンドにARモデルを適用

ということで、ChatGPT3.5に理解を促してもらいます。

ChatGPTの回答1
ChatGPTの回答1のつづき

無知なので、答えじゃなくて、その結果を導くときに使った途中を知りたいと言ってみました。

ChatGPTの回答2
サマリを出力

いろいろ気になるところがあるので、のちほどネットで調べてみます。

いったんARモデルに戻ります。
次は、↓の資料を参考にしつつ、ChatGPT3.5に聞いてみました。

http://www.mi.u-tokyo.ac.jp/mds-oudan/lecture_document_2019_math7/%E6%99%82%E7%B3%BB%E5%88%97%E8%A7%A3%E6%9E%90%EF%BC%88%EF%BC%96%EF%BC%89_2019.pdf

ChatGPTの回答2

これでやっとなんとなくわかった気がしました。
自分の言葉で説明してみます。
「ARモデルとは、過去の値をもとに未来を予測する(こんな基本から)
過去の値に係数をかけるが、係数は最小二乗法などの最適化アルゴリズムを使って決める。」
まだちょっと理解が薄い、、、具体的な計算をしてみたい。。。じゃあなんで、↑の航空機乗客数のトレンドは右肩上がりなのに、予測に限っては右下に下がっていったのか。次回そこらへんをやってみようと思います。
いったん、初学者向けの本を探しにいこうかと思います。

この記事が気に入ったらサポートをしてみませんか?