データサイエンティストの仮説思考②:データを説明する力(+未来予測するには「定常性」が大事!)
読書ノート(127日目)
前回に続いて
今回もこちらの本からです。
この読書ノートでは全5回に分けて
①データを読む力
②データを説明する力
③データを分類する力
④データから法則を見つける力
⑤データから予測する力
を紹介できればと思います。
では、今日は②データを説明する力
についてです。
さて、今回はデータを説明する力
についてでしたが、
言われてみると「そうだよね」と
思うことが多かったです。
中でも、今までグラフを読む時に
特異点、傾向性、相違性の3つに
常に着目できていたかは怪しいので
本書で着目点を整理できて良かったです。
(ここからは本書の内容とは異なります)
時系列データの過去の傾向から
未来を予測しようとしたとき、
以下の4つに分けて考えるようです。
いろいろと探してみたところ
この記事が良くまとまっていたのと
Pythonのコード解説もあり
Pythonで分析を試みる僕にとって
凄く助かりました!
今回の場合は上から順に
・元データ
①傾向変動(トレンド)
②季節変動
③不規則変動(ノイズ)
となっており、①と②と③を合成すると
元データになります。
さらに、時系列データを使って
未来予測をするためには、
時間によらず(ほぼ)一定のパターンだと
いえる「定常性」を追求するべし。
…ということで、今度はこちらの記事が
分かりやすかったので紹介です。
僕も来週に時間をつくって
Air Passengersのサンプルデータを
Pythonで分析してみようと思います。
ということで、今日は
データを説明する力と、
時系列データの4つの要素と
未来予測には定常性が大事!
についてでした。
それでは皆さんも
よい週末をお過ごしください~!😉✨
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?