見出し画像

ChatGPTでデータ分析をやってみた!驚きの結果と活用法を紹介します

PSP株式会社の羽田です。
今話題のChatGPTでデータ分析はできるのでしょうか。また精度はどの程度なのでしょうか。以下のシステムの負荷状況からChatGPTにデータ分析をさせてみました。

システムの負荷状況

傾向の分析

月ごとの負荷状況から傾向を分析してもらいました。
以下が入力内容になります。

以下のデータからどのような傾向が読み取れますか。

年月,CPU使用率の平均,CPU使用率の最大
2021年10月,1.21%,45.42%
2021年11月,1.18%,40.51%
2021年12月,1.31%,47.92%
2022年1月,1.23%,42.37%
2022年2月,1.48%,34.75%
2022年3月,1.59%,47.1%
2022年4月,1.49%,81.04%
2022年5月,1.21%,44.22%
2022年6月,1.6%,76.94%
2022年7月,1.75%,41%
2022年8月,1.78%,66.96%
2022年9月,2.04%,86.05%
2022年10月,2.12%,63.09%
2022年11月,2.18%,68.72%
2022年12月,2.74%,79.29%
2023年1月,2.73%,74.46%
2023年2月,3.31%,78.79%

以下がChatGPTの出力結果です。

このデータから、以下の傾向が読み取れます。

1. CPU使用率の平均値は、一般的には低い値で安定しているように見えます。しかし、2022年9月以降、CPU使用率が2%以上に上昇し始め、2023年2月には3.31%に達しています。
2. CPU使用率の最大値は、一定の変動が見られますが、特に2022年4月と2022年12月には非常に高い値が観測されました。また、2022年9月以降は、最大値の増加が平均値の増加に比べて顕著です。
3. 年末年始の時期(2021年12月、2022年1月、2022年12月、2023年1月)には、平均値や最大値が一時的に上昇しています。これは、ホリデーシーズンや年末年始の大量のトラフィックが原因として考えられます。
4. 平均値と最大値の間には、時期によって差があることが見て取れます。例えば、2021年10月や2022年2月には、平均値は比較的低い一方、最大値はかなり高いです。これは、CPU使用率が一定でないことを示しています。

以下の間違いはありますが、ここまで分析できているのは驚きです。

  • 3に関して12月は高いが1月は高くない

  • 4に関して平均値と最大値の差を比較する意味は無い

今後の負荷を予測

次に今後の負荷を予測してもらいました。
入力内容は以下になります。

以下のデータを踏まえて2023年3月から1年間どのように推移するか予測してください。

年月,CPU使用率の平均,CPU使用率の最大値
2021年10月,1.21%,45.42%
2021年11月,1.18%,40.51%
2021年12月,1.31%,47.92%
2022年1月,1.23%,42.37%
2022年2月,1.48%,34.75%
2022年3月,1.59%,47.1%
2022年4月,1.49%,81.04%
2022年5月,1.21%,44.22%
2022年6月,1.6%,76.94%
2022年7月,1.75%,41%
2022年8月,1.78%,66.96%
2022年9月,2.04%,86.05%
2022年10月,2.12%,63.09%
2022年11月,2.18%,68.72%
2022年12月,2.74%,79.29%
2023年1月,2.73%,74.46%
2023年2月,3.31%,78.79%

以下がChatGPTの出力結果です。

このデータを見る限り、CPU使用率は増加傾向にあるように見えます。しかし、毎月の変動が大きいため、予測は困難です。

ただし、過去のデータからトレンドを予測することができます。過去のデータを基に、2023年3月から1年間の予測を以下に示します。

平均CPU使用率:3.5%〜4.5%
最大CPU使用率:80%〜90%

ただし、予測には多くの不確実要因があります。たとえば、新しい技術やシステムの導入、ユーザー数の増加、またはシステムのトラブルなどが予測に影響を与える可能性があります。

良い予測ではないでしょうか。何を根拠にしているのか気になるので「予測の根拠を教えてください。」と聞いてみます。
以下が回答結果になります。

この予測は、過去のデータを基にしたトレンド分析に基づいています。具体的には、過去のデータを分析し、CPU使用率が増加傾向にあることを確認しました。また、CPU使用率の最大値が非常に高いことから、将来のピーク時には80%〜90%のCPU使用率が予想されます。

ただし、この予測は過去のデータから導き出されたものであり、将来のイベントや環境の変化によって変更される可能性があります。そのため、この予測はあくまでも参考程度にとどめ、将来の変化に適応できるように継続的にモニタリングする必要があります。

真偽は分かりませんが、トレンド分析から導き出したようです。

まとめ

今回はシステムの負荷状況からChatGPTにデータ分析をさせてみました。データの傾向の読み取りや今後の予測が出来ることには驚きました。特に傾向の分析で12月のCPU使用率が高い点は気づけていなかったため、新たな視点を得られるという意味では非常に便利に感じました。ただ分析に信頼性が無い点は注意が必要です。
今後もChatGPTやNew Bingの活用法についての記事を書いていこうと思います。
興味のある方は是非フォローお願いします!

以前の記事はこちら