見出し画像

オフィスのDX推進。Chat GPTでPDFファイルをテキスト変換

お客様からPDFファイルをいただくことがあります。オフィスでこれを単に資料として利用するケースもあると思いますが。分析に使おうとすると大変不便です。
そこでOCR的にPDFファイルから直接テキスト化できたら便利と。実験をしてみました。

解説の動画をどうぞ

架空の請求書をつくりました。

PDF化した架空の請求書

これが読めるか実験をしてみたわけです。

PDFファイルのテキスト化に成功

PDFファイルのテキスト化に成功しました。
さらにCSVファイルとして情報が得られると便利なので、CSV化しましたが失敗。そこでさらなる工夫をしました。

PDFをCSV化するプロンプト

PDFをCSV化するプロンプトです。

この記事が気に入ったらサポートをしてみませんか?