見出し画像

ChatPDFがすごい

ChatPDFという、OpenAI社のチャットボットがあります:

pdfをポンと放り込み、そのテキストに関して質問すれば回答してくれます。ChatGPTのAPIを使っているそうです。そしてこれがすごいのです。

先日、生成文法がご専門である金沢学院大学の嶋村貢志先生(ゆる言語学ラジオではお馴染み)が、以下の論文:

Keir Moulton, "Clausal Complementation and the Wager-class," Proc. of the 38 the Annual North East Linguistics Society Vol 2.
http://individual.utoronto.ca/keirmoulton/Moulton_NELS38.pdf

をtweetされていました。これは以下のtweet:

に関連して紹介されたものです。ECM(これが何かは以下でChatPDFが回答してくれています)が可能な単語とそうでない単語との違いを高校レベルでどう説明するのか?という疑問を投げかけるtweetかと思います。

嶋村先生は「統語論的には以下の論文に答えがあります…」と仰って、上記の論文を挙げていました。私はその答えを知りたいと思い、論文を読もうとしたのですが … まあ一切わかりませんでした。知らない単語が多く、そのたび辞書を引かなければならないし、専門用語もそれに関連する概念もちんぷんかんぷん、という感じで、一切理解が進みませんでした。

そこでいっちょChatPDFでも使ってみるか、ということで、ポンと放り込んで質問をしてみるとまあすごい。以下、質問と回答を列挙します:
(・の行が質問、…の後がChatPDFの回答です)

・ECMとはなんですか?
… ECM(Exceptional Case Marking)とは、英語の文法用語で、ある種の動詞が自身の目的語を取らずに、代わりにその目的語が他の動詞によって支配される構文現象を指します。ECMは、主に「think」「believe」「seem」などの心的態度を表す動詞によって引き起こされます。この現象は、ページ1およびページ10で言及されています。

・Weger-classとはなんですか?
… wager-class」とは、態度動詞の一種であり、例えば「wager」や「bet」などが含まれます。このPDFファイルでは、wager-classに関する長年の謎であるECM(Exceptional Case Marking)について説明されています。ECMとは、主語が補完子節内に現れず、代わりに外側の文の主語を共有する構文です。Wager-class動詞はこの構文において特別な振る舞いを示すため、「wager-class」と呼ばれるようになりました。

・B-class verbとはなんですか?
… ページ7にある「B-class verbs」とは、動詞の分類の一つで、自己主張(self-assertion)や感情(emotion)などを表す動詞のことを指します。B-class verbsは、propositional complementを取る際には、complementizerが必要とされます。また、B-class verbsはraising to objectやpassive raisingに対して不適切であるため、これらの構文現象が起こりません。ページ7では、「B-class or a wager-class verbs」という表現が使われており、wager-class verbsも同様にcomplementizerが必要とされます。

・believe関数の引数の意味を教えてください
… ページ6の(13)にある「believe関数」は、λx.c.λe.λw.believe(xc)(e)(w)という式で表されます。この式における引数の意味は以下の通りです。
- x: believe関数が受け取る抽象的な個体を表します。
- e: believe関数が受け取る命題を表します。つまり、信じられる対象となる命題です。
- w: believe関数が受け取る世界を表します。つまり、信じられる対象となる世界です。
このように、believe関数は抽象的な個体x、命題e、世界wを引数として受け取ります。そして、この関数は「xがeをwで信じている」という意味を表します。

・P5(9)のpとはなんですか?
…ページ5の(9)にある「p」は、命題を表す変数です。Kratzer (2006)では、命題は世界に対する真偽値を持つものとして定義されています。このような命題を表す変数は、論理学や意味論で一般的に使用されます。ページ5では、「[[ believe ]]」という動詞の意味を説明するために、「p」という変数が使用されています。

・P5(9)のDoxとはなんですか?
…「Dox」関数は、2つの引数を持ちます。最初の引数「x」は、態度を持つ人物を表します。2番目の引数「w」は、世界を表します。この関数は、「x」という人物が「w」という世界で信じることができる可能性のある世界の集合を返します。つまり、「Dox(x, w)」は、「x」という人物が「w」という世界で信じることができる可能性のある世界の集合を表します。ページ5において、式(9)では、「[[ believe (p)(x)(w) ]] = 1 iff w’ ∈ Dox(x, w): p(w’) = 1」という式が示されています。この式では、「Dox(x, w)」が使用されています。

・P5(11)のcompatibleとはなんですか?
… ページ5の(11)にある「compatible」という単語は、世界と個体の関係を表す述語です。この述語は、「that」節が表す命題が成立する可能性のある世界と、その命題が適用される個体との間に成立する関係を表します。ページ5の(11)では、「[[ that ]] = λp.λx.c[ w’ (compatible(xc)(w’) → p(w’))]」という式が示されています。この式では、「compatible(xc)(w’)」が使用されています。これは、個体「xc」と世界「w'」が互換性があるかどうかを判断する述語です。つまり、「compatible(xc)(w')」は、「xc」と「w'」が互換性がある場合に真を返し、そうでない場合に偽を返します。

ChatPDFとの会話。・の部分が質問。…の後がChatPDFの回答


このように、概念の説明、関数の意味やそのargumentの意味まで答えてくれます。しかも日本語で回答してくれるのです。これにより、少なくとも[[…]]が存在する式の意味解釈はわかるようになりました(※[[…]]は、… の部分に存在する日常言語の意味解釈をメタ言語で論理的に定義するときに使う記号)。もちろんChatPDFがおかしなことを言うときもありますが、文脈などから判断するとなんとなくその真偽がわかるものです。また私などは素人であり、多少の思い違いをしていても、おおざっぱに理解していればそれでという感じなので問題ないです。

しかもすごいことに、テキストに書いていないことも回答してくれます。上記の会話でChatPDFはECMについて説明してくれていますが、これは本文には書いていません。ChatPDFはChatGPTを使用しているとのことなので、基本的にはどんな質問にでも答えてくれるのでしょう。

まとめ

ChatPDFはOpenAI社のチャットボットであり、テキストに関する質問に対し回答をするAIです。前章にあるように、高度で専門的な学術用語に関しても丁寧にわかりやすく回答してくれます。しかも本文には存在しないことでも答えてくれます。論文読解のアシスタントとして非専門家には極めて有用です。

物理学関連での論文で使ったことは何度かあり、そのときもすばらしかったのですが、しかし物理学の概念てけっこういろんなテキストに記述されていますし、また言語学のような分野ほど概念が込み入ってなく、機械には理解・記述しやすいのだと思っていました。それが言語学関連論文でもこれほど役に立つとは思っていなかったので感動しました。

論文は、一定の割合わかると途端に全体的な理解が進みます。全く理解できなかった本論文が突然(全く理解していなかった時と比較すれば)理解できるようになりました。ChatPDFに蒙を啓かれた感じです。このように専門家でない人間が論文を読むには凄まじく役に立つAIです。ぜひ使ってみてください。

おしまい。$${{}_\blacksquare}$$


この記事が気に入ったらサポートをしてみませんか?