時系列データをpython【#2.2】ARモデル
以下の本から時系列データの部分を勉強しましたので、少しここに書こうと思います。※アフェリエイトはしていません。でもこの本はすごくいい本なので、これで知識を増やす、勉強するのはいいことだと思います。(アフェリエイトではなく、自分の一生ものの能力をつけるために約3000円でこの本を買って、月給3000円上げようというモチベーションです。)
今回は、第7章のあたりをやっていきます。
前回航空機乗客数のトレンドを書いたので、それに対して、AR・ARMA・ARIMA・SARIMAモデルを適用してみようと思います。
ARモデル(Autoregressive model)
自己回帰の関係性を記述
ARMAモデル(Autoregressive moving average model)
移動平均の項かを追加
ARIMAモデル(Autoregressive integrative moving average model)
トレンドの効果を追加
SARIMAモデル(Seasonal autoregressive integrative moving average model)
周期(季節)効果を追加
だそうです。数式のあたりも気になりますが、いったんどんな違いが出るかみてみようと思います。何も考えずに、google colab付属の生成AIで「ARモデルを使うってどういうことか」を見てみます(何も考えていない)。
その結果が↓です。なにかよくわかりませんが予測をしているようです。
ということで、ChatGPT3.5に理解を促してもらいます。
無知なので、答えじゃなくて、その結果を導くときに使った途中を知りたいと言ってみました。
いろいろ気になるところがあるので、のちほどネットで調べてみます。
いったんARモデルに戻ります。
次は、↓の資料を参考にしつつ、ChatGPT3.5に聞いてみました。
これでやっとなんとなくわかった気がしました。
自分の言葉で説明してみます。
「ARモデルとは、過去の値をもとに未来を予測する(こんな基本から)
過去の値に係数をかけるが、係数は最小二乗法などの最適化アルゴリズムを使って決める。」
まだちょっと理解が薄い、、、具体的な計算をしてみたい。。。じゃあなんで、↑の航空機乗客数のトレンドは右肩上がりなのに、予測に限っては右下に下がっていったのか。次回そこらへんをやってみようと思います。
いったん、初学者向けの本を探しにいこうかと思います。
この記事が気に入ったらサポートをしてみませんか?