見出し画像

ChatGPT4:ノーコードでPythonデータ可視化 Pt.3[データ前処理]


以下のようなデータの前処理は、ChatGPT(Code interpreter)にお願いすると楽ですよぉ。

↓↓↓↓↓↓



実施したデータの前処理

このデータは仮想データです。

数値(int, float)、16進数、カテゴリーが混在しています。
欠損値(NaN)もありますね。

このデータで、以下の前処理を行いました。
口頭(テキスト)指示だけ。。。これだけで?と拍子抜けしました。「〇〇して」と伝えているだけですが、詳しくは実行例をみてください。

  • 16進数のデータ列を10進数に変換

  • データの70%以上がNaNの列は削除

  • カテゴリーデータの列をラベルエンコーディング(0,1,2…)

実行例



最後に

例えば、以下のように一度にあれもこれも指示をすると、Chatくんは一部の処理し忘れちゃうことがありますので、ひとつづつ前処理して ➡︎ データ確認… したほうがよさそうです。

  • データの70%以上がNaNの列は削除し、データが16進数の列があればすべての列を10進数に、NaNデータがあるデータ行は削除して、データフレームを書き出して下さい。


それにしても、これは楽やぁ😂。
全然 手間かかりません。



※ 欠損値の削除は、慎重にならないといけない時もありますね。
「欠損値の補完」は以下の記事の最後の方で触れてます。


この記事が参加している募集

やってみた

よろしければサポートお願いします!