![見出し画像](https://assets.st-note.com/production/uploads/images/109772283/rectangle_large_type_2_2d8cf17a0698700d1548c1f095547bce.png?width=800)
PandasAI:次世代の分析ツール
まだ開発途上のPandasAIのようですが、どのようなものかPandasAIのブログを参考にコードを真似てみました。ブログには次のように書かれていました。
「この革新的なツールは、データ分析タスクを大幅に強化し、より速く、より効率的に、そして実に楽しいものにするように設計されています。」
「Pandas は、10 年以上にわたって構造化データの操作と分析に頼りになるツールです。しかし、データセットはますます大きくなり、より複雑になるため、これらの課題を簡単に処理できるツールが必要です。そこで PandasAI が登場します。」
感想としては、これが進化して、言葉でデータから洞察、インサイトが得られるようになれば、Pandasの関数やメソッドは覚える必要性が薄れていくだどうなと。。。
ここでは架空の二酸化炭素排出量を使って可視化してみました。
!pip install pandas==1.5.3 pandasai==0.6.7
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
#pandasを使ってデータフレームを作成
df = pd.DataFrame({ "country": ["United States", "China", "India", "Russia", "Japan"], "emissions": [round(5269.480), round(10065.36), round(2654.628), round(1711.24), round(1162.55)], "rank": [2, 1, 3, 4, 5]})
#llm(ここではOpenAI)をインスタンス化。
OPENAI_API_KEY = "YOUR OPENAI_API_KEY"
llm = OpenAI(api_token=OPENAI_API_KEY)
#次に、大規模言語モデル(llm)を用いてPandasAIをインスタンス化、データフレームとプロンプトを渡して実行。
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which country has the fifth highest emissions?')
PandasAIの答え 'Japan'
#ヒストグラムを表示
pandas_ai.run(df, "Plot a histogram of countries showing their respective emissions in order of emissions, using different colors for each bar.")
![](https://assets.st-note.com/img/1688284228375-DeA7AWt4Ow.png)
#パイチャートを表示
pandas_ai.run(df, "Plot a piechat of countries showing their respective emissions in order of emissions, using different colors for each pie.")
![](https://assets.st-note.com/img/1688284260372-amRqJtd8Rm.png)
この記事が気に入ったらサポートをしてみませんか?