ChatGPTとAIチャットボットの特許調査業務への応用

1. はじめに

 OpenAI社が2022年11月に発表したChatGPT※1が、その性能の高さから話題になっている。本コラムではChatGPTやその他の類似サービスについて、特許調査業務への応用可能性の観点から考察する。

※1 https://openai.com/blog/chatgpt/


2. ChatGPTとは?

 ChatGPTとは、米国シリコンバレーのスタートアップ企業であるOpenAI社が開発したAIチャットボット(対話エンジン)である。OpenAI社は、言語モデルGPT(Generative Pretrained Transformer)※2 を開発した企業として知られており※3、ChatGPTはその後継版であるGPT-3.5をベースに開発された。ChatGPTは2022年11月にプロトタイプ版が公開されてから、その性能の高さが話題になっており、公開後2ヶ月でユーザー数が1億人を超えるなど、サービス拡大の速さからも注目されている。

※2 Radford, Alec, et al. “Improving language understanding by generative pre-training.” (2018).
※3 イーロン・マスクやピーター・ティールなど著名な企業家が設立に関わったことでも有名である。


3. ChatGPTの使用例

 ChatGPTはブラウザでウェブサイトにアクセスし、ユーザー登録を行えば無料で使うことができる※4。図1にChatGPTのウェブサイト画像を示す。ページ下部に質問を入力するテキストボックスが配置された非常にシンプルな構成になっている。


図 1 ChatGPTの画面


 ChatGPTの使用例を以下に示す。従来のチャットボットと比べて、正解のないような複雑な質問にも答えられることが分かる。なお、日本語にも対応している。


図 2  ChatGPTの使用例(1)


図 3  ChatGPTの使用例(2)


図 4  ChatGPTの使用例(3)


※4 サム・アルトマンCEOは、ChatGPTの有料化を検討している旨公言しており(https://twitter.com/sama/status/1599669571795185665)、今後有料化される可能性がある。なお、2月1日に有料プランであるChatGPT Plusが公開されている。


4. ChatGPTの問題点

 このように非常に性能の高いChatGPTであるが、問題点も指摘されている。

4.1 情報が最新でない

 ChatGPTは、学習データが2021年までの情報に基づくため、それ以降の話題には対応できないようである。なお、この点は後述するMicrosoftのBingでは解消されているとされる。


4.2 情報の正確性

 そもそもの学習データが誤っていたり、AIが誤った回答を導き出す可能性があるため、回答を鵜呑みにすることはできない。回答が自然な分、かえって間違いに気づきにくい点は、Google翻訳やDeepLなどのディープラーニング系の機械翻訳と同様である。また、そのような誤った情報に基づくコンテンツがインターネット上に大量に拡散されることによって、正しい情報へのアクセスが困難になり得ることも指摘されている。なお、後述するBingやPerplexity Askは情報ソースを明示することによって正確性を担保している。


4.3 キャパシティ

 上述したように、ChatGPTは現状無料で利用することができ、急激にユーザー数を伸ばしたため、アクセス制限がかかることがある。ただし、この点は今後のサービスの有料化や投資により改善されると思われる※5。


図 5 アクセス制限画面。ラップやシェイクスピア風の文章など、様々なスタイルで回答してくれる。


※5 https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/


5. 関連・類似のサービス

5.1 Microsoft社BingとEdge

 Microsoft社はOpenAI社に出資しており、同社の検索エンジンBingやブラウザEdgeにChatGPTの技術を導入している。Microsoft社はChatGPTを独自に改良しており、学習データのアップデートや根拠となる情報ソースの表示など、上述したChatGPTの問題点を改善している 。


5.2 Google社「BARD」

 2月6日にはGoogle社も対話AIの「BARD」を発表している※6。BARDは同社の言語モデルLaMDAをベースに開発され、2023年1月までの直近のデータを学習しているとされる。本ブログ執筆時点ではテストユーザーのみの公開であるが、近く一般公開されるとみられる。

※6 https://blog.google/technology/ai/bard-google-ai-search-updates/


5.3 Perplexity AI社「Perplexity Ask」

 ChatGPTと類似するサービスとして、2022年12月にPerplexity AI社の「Perplexity Ask」が公開されている※7。このサービスは、ChatGPTと比較して情報検索に重点が置かれており、回答の根拠となる情報ソースを表示する点で信頼性を向上させている。


図 6 Perplexity Askの画面。画面中段に回答の根拠となる情報ソースを表示している。

※7 https://www.perplexity.ai/


5.4 SciSpace

 SciSpace(旧・Typeset)は学術論文の作成・読解用のAIサービスである。Copilot と呼ばれるAIチャットボット機能を備えており、PDFをアップロードすることでその論文※8の内容を対話形式で回答させることができる。


図 7 SciSpaceで「切り餅」特許を読み込ませた例。画面右の「Copilot」機能により、対話形式で文献の内容等を回答させることができる。

※8 特許文献も読み込ませることができるようである。


6. 特許調査業務への応用例

 ChatGPT等の特許調査業務への応用を検討・考察した。

6.1 事業・技術理解タスク

 特許調査においては、まず事業や技術の理解が不可欠である。知見がない分野を調査する場合、現状においては、まずインターネット検索により情報収集を行うサーチャーが多いと思われるが、ChatGPTを使用することにより情報収集の効率化が図れる可能性がある。特にPerplexity AskやBingなど情報ソースを表示するサービスは情報の信頼性の面で使い勝手がいいと思われる。


6.2 検索タスク

 ChatGPTで「自動運転」を検索すると一応それらしい回答が返ってくるものの(図8)、特許データベースで検証すると、特許番号と内容が食い違っていることが分かる。特許を直接検索するようなタスクには向いていないようである※9。一方で、同義語やIPCに対する回答については、一定の精度があるようである(図9,10)。ただし、誤った情報や不正確な情報が紛れる可能性があることから※10 、参考程度とすべきと思われる。

※9 ただし、広くウェブ情報を学習していることから、技術分野によっては非特許文献の調査に威力を発揮する可能性がある。
※10 特にIPCとその定義には違和感があるものがある。


図 8 ChatGPTに自動運転に関する特許を回答させた例


図 9 ChatGPTに同義語を回答させた例


図 10 ChatGPTにIPCを回答させた例


6.3 査読、分類タスク

 ChatGPTやBing(Edge)、SciSpaceは文書の要約も可能である。また、「課題」などの特定観点での質問も可能であるため、査読や分類の効率化が図れる可能性がある。ただし、ここでも誤った情報が含まれる可能性があることに留意する必要がある。


6.4 分析タスク

 特許件数の企業間比較を回答させることもできるようであるが、データがないはずの2022年のデータを出力しており、信頼性には疑問が残る。また、学習データの特性から欧米以外の企業の比較は不得意である可能性がある※11。


図 11 ChatGPTにFordとGMの米国特許出願件数を比較させた例


※11 トヨタ、日産、ホンダの比較は回答を得ることができなかった。


7. 特許調査業務への活用にあたっての課題

7.1 情報の正確性

 いずれのサービスも回答の正確性については保証されていないため、情報は参考程度に留めざるを得ない。BingやPerplexity Askなどは、情報ソースを明示することで信頼性の担保を図っているが、いずれにせよ情報を検証する必要がある。


7.2 セキュリティ

 他のウェブサービスにも言えることであるが、情報を外部サーバーにアップロードする必要があるため、情報の取り扱いには注意が必要である。


7.3 洞察や気付きの機会

 自動要約は業務効率化の点で非常に便利である反面、特許文献を直接読むことにより得られる洞察や気づきを得る機会は失われる。また、チャットボットは基本的に聞かれたことしか回答しないため、当初想定を超える情報を得ることは難しい。


8. 想定される今後の展開

 以上、ChatGPTやその他の類似サービスの特許調査業務への応用を検討した。これらAIチャットボットには課題はあるものの、使い方次第では強力なツールであることに変わりはなく、今後、特許調査業務へ組み込まれていく可能性は十分考えられる。
 MicrosoftがBingやEdgeにChatGPTを組み込んだように、GoogleもGoogle検索やChromeにBARDを追加してくることが想定される。そうすると、AIチャットボットを使った検索や調査が通常になると思われる。特にGoogleはGoogle PatentsやGoogle Scholarなどの文献検索サービスも有しているため、この点でも特許調査業務へのAIチャットボットの普及は想像に難くない。また、商用特許データベースについては近年、各社ともAIの実装を進めており、AIチャットボットの搭載も進むであろうと考えられる。


9. 当社におけるAIの活用

 当社ではChatGPTやその他の類似サービスを通常の特許調査業務に利用することは、情報の正確性やセキュリティ上の懸念から行っていない。その一方で、AI技術やAIツールについては、従来より情報収集や研究を行っており、外部サーバーを利用しないオンプレミスのAIについて5年ほど前から開発・活用を進めている。社内向けの調査補助ツールとして一定の成果を出している。
 当社は、今後も引き続きAI技術の発展を注視するとともに、お客様へより良いサービスが提供できるよう、その有効活用を検討していく方針である。


調査事業部 静野

弊社へのご依頼はWebサイトへ。ご相談にも乗りますので、まずはお気軽にお問い合わせください。 http://aztec.co.jp/