見出し画像

チャレンジGPT_3.もう「ChatPDF」でええんよ

本ノートは、プロンプトで GPTと会話することを覚えて、思い通りに(ときには思い通りじゃなく)動くGPTに気をよくした私の、GPTとすごした日々を記録するノートです。

すでにプログラミングなどできる方には参考にならない内容が盛りだくさんかと思いますが、僕とGPTとの愛と友情の記録としてマガジンにまとめていきたいと思います。

前置き


「機械を使って何がしたいんだ」って、そら、楽したいに決まってるでしょうが!

第何次だろうが、産業革命といったら、人が楽になって失業するって、決まってるでしょうが!

私は、早く楽になって、ゆりかごの上でバナナを食って過ごしたいんですよ!

過去から現在に渡って、公私ともに、日々リソースを割くのは、「先人たちの記憶の呼び起こし」なんですよ!!

「背中で学べ」とか、「見て盗め」とか、「わからないことあったら聞いてね」とか、時間かけりゃいいってもんじゃないんですよ!!

デスクワーカーのワタシ的には、インターネットを使うことで、ダイブ楽にはなった反面、情報過多で、探すのに時間がかかるんですよ!

なんとかして楽するためには、その情報の整理が一番重要なんですよ!!!


ということで、chatGPT登場以降、その「先人たちの記憶の呼び起こし」がめちゃくちゃ楽になって喜んでおるわけですが、そうなってくると、次の欲が出てきます。

「一般論じゃなくて、もっとピンポイントな回答がほしい」

もう皆さんご存知のとおり、chatGPTは2021年までの情報しか学習されておらず、例えば「2023年のWBCの優勝国は?」のような質問に対する答えは持っていません。

その問題点に対する答えには、いち早くMicrosoftさんがBingをリリースしてくれて、解消されましたが、「なんかちょっと違う」のは、仕事で使うやつは「もっと限定的な検索対象でいい」ということなのです。

※そうなんだけどそうじゃない、Microsoftのbing

世界中のインターネットから情報を集めて回答してるって、それは、結局、「最新の一般論」なのよ。


で、そういう要望を解消するために、他にも、数々のアプリケーションが世に出回っていますが、私が、「こういうので、ええんよ」と思ったのが「ChatPDF 」

こいつはなんと、PDFファイルをアップロードするだけで簡単にAIチャットボットを作成し、「大きなPDFファイルから情報を抽出する」ことや「質問に答える」ことができるそうで、
「大学生」や「研究者」が、研究論文から情報を抽出することや、契約書から必要な情報を見つけることに役立てることができるそうです。

※以下、OpenAI 開発者フォーラムでも活発にやりとりされていますので、GPTの名前だけ借りた胡散臭いツールではないと思われます。

これよこれ、そういうことなんよ。
広大なインターネットを検索して、複雑な文章を要約して〜なんていらんのよ。


chatPDFの使い方


以下リンク先で、PDFを読み込むだけ!
それだけ!!

1.リンク先にアクセスする

ChatPDF - Chat with any PDF!

アプリ版


2.PDFを放り込むだけ

↓ここに、pdfデータを入れるだけ。

ここに PDFをドロップ!!!

今回は、「厚生労働省」さんから、「健康日本21」より、「アルコール」に関するPDFをいただき、アップしてみました。

すると、以下のようにchatが開始されます。

■chatPDFくん >>
PDFファイル「アルコールに関する基本方針」をご覧いただきありがとうございます!このファイルでは、アルコールが健康や社会に与える影響について詳しく説明しています。アルコールを飲む機会が多い日本において、正しい知識を持って飲酒することが大切です。以下は、このファイルについての質問例です。

▶アルコールの健康への影響について、具体的にどのような疾患が関連するのでしょうか?
▶未成年者の飲酒防止について、地域や学校でどのような取り組みが行われているのでしょうか?
▶ 多量飲酒問題について、早期発見や適切な対応をするためにはどのような支援が必要なのでしょうか?

以下実際の画面
アルコールに関する質問を受け付けてる!


試しに、「飲みすぎってよくないの?」ってふんわりした質問をします。

■わたし>
飲みすぎってよくないの?

■chatPDFくん >>
はい、飲みすぎは健康に悪影響を与えることがあります。アルコールの過剰摂取は、肝臓や膵臓、心臓などの重要な臓器にダメージを与えることがあります。また、アルコール依存症や交通事故などのリスクも高まります。ですから、節度ある飲酒を心がけることが大切です。詳しくは、PDFファイル「アルコールに関する基本方針」の3ページ目をご覧ください。

以下実際の画面
ちゃんと答えてくれる!!

どこを読めばその情報が載っているかまで、教えてくれます。

だよね!
臓器にダメージがあるからダメだよね!
正解!

■わたし>
どのくらいの量飲むと飲み過ぎになるの?

■chatPDFくん >>
PDFファイル「アルコールに関する基本方針」の4ページ目によると、成人男性で1日に日本酒で換算して3合(純アルコールで約60g)以上を飲む場合は、多量飲酒とされています。ただし、個人差がありますので、一概に量だけで判断することは難しいです。また、女性や高齢者などはアルコールの代謝が遅いため、同じ量を飲んでも影響が大きくなることがあります。詳しくは、PDFファイル「アルコールに関する基本方針」の4ページ目をご覧ください。

以下実際の画面
3合までだってよ!

言われたとおりP4 を確認すると、以下のとおり、「多量飲酒者」の定義つけのなかで、3合以上とされてる!
すごい!

1日3合飲んだらダメなんだってよ!

使い方は、これだけ!!
シンプル!!
スマート!!!

これよこれ。
こういうのでええんよ。


ためしに色々聞いてみる

・最新のデータを聞いてみる

今年(2023年)のデータを聞いてみたら、データは持ってないとのことだったけど、関連のウェブサイトを教えてくれた

■わたし >
今年のデータで、一世帯あたりの飲酒量が多い県を教えて

■chatPDFくん >>
申し訳ありませんが、私が提供できる情報源には、一世帯あたりの飲酒量が多い県に関するデータは含まれておりません。しかしながら、国立社会保障・人口問題研究所の調査によると、日本全体のアルコール消費量は減少傾向にあります。詳細については、同研究所のウェブサイトをご確認ください。

以下実際の画面

・言われたウェブサイトのURLをもとに聞いてみる

URLを参照するように促してみたけど、548ページもないし、本資料は2000年までのデータだそうだけど、chatPDFくんには1994年までしかないと言われた。

■わたし >
以下URLから調べて、日本の飲酒量が多い県を教えて
https://www.jstage.jst.go.jp/article/jbrewsocjapan1988/98/8/98_8_544/_pdf

■chatPDFくん >>
おっしゃる論文によると、日本の飲酒量が多い県は、男性においては秋田県、女性においては福井県であることが示されています(p. 548)。ただし、この論文のデータは1993年から1994年のものであり、現在の状況と異なる可能性があります。

以下実際の画面
PDFのぺージ数ではなく、PDF内のページの表記を読み取っているんだと思われる


・まったく関係ないことを聞いてみる

今年のWBCの優勝国を聞いてみたけど、さっきみたいな「サイトの紹介」すらしてくれなかった。
アルコールに関する質問じゃないからなのかもしれない

■わたし >
今年のWBCの優勝国は?

■chatPDF >>
申し訳ありませんが、私はアルコールに関する情報を提供するためのPDFファイルであり、スポーツに関する情報は持ち合わせておりません。お探しの情報については、スポーツニュースなどの専門的な情報源をご確認ください。

以下実際の画面

・SQLを書いてもらう

書いてくれた(いけるんかい!)

■わたし >
以下でSQLを書いて
SELECT *
From table
WHERE  my column 10より大きくて400より小さい値

■chatPDF >>
以下は、おっしゃる条件に基づいたSQL文です。

```
SELECT *
FROM table
WHERE my_column > 10 AND my_column < 400;
```

このSQL文では、`table`というテーブルから、`my_column`というカラムの値が10より大きくかつ400より小さいレコードを取得しています。必要に応じて、テーブル名やカラム名を適宜変更してください。

以下実際の画面

chat PDFの限界

と、このくらいが、chat PDFの限界のもようです。

他にも、画像ファイルを読み込ませてみましたがさすがに弾かれ。
画像ファイルを PDFにまとめ直して読ませてみたりしましたが、読み込まれませんでした。

pdfはpdfでも、textをtextとして保存されてないものはダメだということで
「テキストを読んで答える」という基本仕様は覆らないもよう。(そらそーだ)

今後は、画像もプロンプトとして読ませることができるようになるとかなんとか
なのと、頑張れGoogle。画像認識といえばGoogle。

そうこうしていると、無料の限界に到達してしまう

無料と有料で違うのは以下のとおり。

chatPDFサイト「Pricing」より引用

試しに推理小説でも読み込ませて「犯人は誰?」とか聞いてみたかったんですけど、120ページの上限や、10MBの上限に簡単にひっかかり、そこまでは確認できず。。

仕事で使うなら、その情報量は推理小説以上になるのは明白ですので、ちゃんと使うならお金をかけようということになると思われます。

また、1日50クエッションも、すくなーーーい!

「月額700円くらいだったら、課金してもいいかな」とも思いましたが、
いやいやちょっと待てよ。と。
そもそも、このサービスがやってることが仕事に使えることはわかったけど、これに仕事のナレッジ(先人たちの記憶)を流し込むのはリスクがあるんでないか。
ということです。

※利用規約はあるんですけど、そのへんの情報の取り扱いにはゆるそうです。

※そうじゃなくても、私の勤める会社のAIツール利用ポリシー的にも、やっぱり大手が責任もってくれるツールじゃないと仕事では使えないよね。ということで。

「こういうのでええんよ」のまとめ

  • いろいろ検索してくれなくても、こちらが指定した情報をメインに答えてくれればええんよ

  • 同じ構造であれば、エンジンは GPT 3.5 でええってことなんよ

  • 適切な資料があればプロンプトはそんなに頑張らなくてええみたいなんよ

  • 多少トンチンカンなこと言ってても、参照すべきページが記載されてあれば確認しやすいんよ

  • 読み込ませる資料の取り扱いは、やっぱり信頼できるところがええんよ

  • そうなってくると、やっぱり自分で開発するしかないんか?


というわけで、数回にわたって繰り広げられてきたチャレンジGPTの序章「GPTは仕事で使えることがわかった」編は本noteで完結です。

次章より「ついに自分でツールを作り始めるなのか」編がスタートします

たぶん。

この記事が気に入ったらサポートをしてみませんか?