PDFとWordをテキストとして扱う

文章を扱うのが得意なChatGPTさん。
これまでにファイルをそのままぶち込んで、読み込むことでそこからさらに色々やってもらってきたから、これらのファイルも直接ぶち込めば理解してくれる。

大量の文字データのファイルを処理する

現在、プロンプトとして入力できるのは2万文字程度。ただしテキストファイルとして読み込んだ場合は、512MBまでになるので2億5600万文字まで扱うことができる、不思議だね。

ただしChatGPT自体が返す文章も3万文字程度に制限を受けてしまうため、大量すぎる文章はやはり取り扱うことができません。
なので長文を使うときは、文章を分割していきます。

アップした文章を10000文字ごとに分割して、テキストファイルに書き出して。

こんな感じで分割してくれました。

ファイルを分割することができたら、まとめて内容を要約してもらいます。

こんな感じで、ちょっとずつ進めていけば大量の文字を有する文書ファイルでも要約することが出来そうですね。これは議事録とかにも使えそうかも。

docやpdfに変換する

またこの文章をWordやPDFにすることもできます。ただしPDF化する場合は文字化けしてしまうので、日本語ファイルも一緒にアップする手間が必要。

・ ファイルをwordファイルに変換してください。

・ ファイルをこの日本語フォントデータを使って、PDFに変換してください。
   文書内に日本語がしっかり収まるようにレイアウトしてね。
無事、PDF化された文書をDLできました。

まあPDF化については、あまり使うことはないと思いますがChatGPTと話したデータを忘れないために、Wordファイルとしてダウンロードしておくとかはいいかもしれませんね。

まとめ

今回は、PDFとWordの活用方法を見てみました。
ファイルにすると、さらに大きな文章を扱えるようになるというのは、今後覚えておくと役に立ちそうです。

よろしければサポートお願いします。 投げ銭で頂いたものはコーヒーやラムネなど創作のお供に返させていただきます。