『「超」創造法』生成AIで知的活動はどう変わる？

2023年10月3日 09:08

『「超」創造法』生成AIで知的活動はどう変わる？(幻冬舎新書)が9月27日に刊行されました。
これは、第12章の5の全文公開です。

５　生成系ＡＩは、ウェブ記事サイトを壊滅させるか

生成系ＡＩで記事を読めるかどうか実験してみた

　生成系ＡＩを使ってウェブの記事を読めるでしょうか。
　もしできれば、いちいちサイトを訪れなくても記事を読めるので、閲覧者には非常に便利です。第２章の２で述べたように、記事の要約を作ることを生成系ＡＩに頼むこともできます。こうして情報収集活動が劇的に効率化します。
　しかし、著者やサイト運営者の立場からすると、もしこうしたことができると、大問題です。著作権が侵害されることになりますし、サイトを訪れる人がいなくなってしまうからです。
　そこで、Bing とBard を用いて実験を行なってみました。
　最初は、「現代ビジネス」に公表された私の記事を読めるかどうかの実験です。つぎのように質問します。
　（１）「ChatGPT の成果を左右するプロンプトエンジニアリング、その活用のポイントと課題―まず『何を求めるか』を把握してから」（（２）この記事の本文は、つぎの小見出しから始まります。「『プロンプトエンジニアリング』の登場」。これに続く本文の最初の文章は何ですか？
　（３）この記事の本文の最後の文章は何ですか？

Bardは、ウェブの記事を読めるようだ

　Bing は、（２）、（３）とも、プロンプトエンジニアリングという言葉に関係すること（私の記事には入っていない事項）を適当に並べただけで、とても私の記事を読んだとは思えません。タイトルを読んだだけではないかと疑われます。
　ところが、Bard の答えは、つぎのようなものでした。
　（２）プロンプトエンジニアリングとは、生成系ＡＩがよりよい結果を出せるように、プロンプトを設計する技術です。
　（３）プロンプトエンジニアリングは、生成系ＡＩを活用する上で、重要な技術と言えるでしょう。

　（２）、（３）についての正解は、つぎのとおりです。
　（２）「プロンプトエンジニアリング」という言葉が見られるようになりました。
　（３）プロンプトエンジニアリングの重要な課題でしょう。

　Bard の答えは、これと完全に一致しているわけではないので、判断が難しいところです。しかし、「不完全ながら読めている」と考えることができるでしょう。

Bingは、新聞の社説を読める

　もう一つ実験しました。今度は、新聞の社説。これは、各社ともインターネットに無料で公開しています。つぎのように問いかけます。
　（１）［社説］米利上げ｢休止｣も物価高対応を万全に（（２）最初の文章を示してください。
　（３）最後の文章を示してください。

　正解はつぎのとおり。
　（２）米連邦準備理事会（ＦＲＢ）は14日の米連邦公開市場委員会（ＦＯＭＣ）で政策金利の据え置きを決めた。
　（３）市場との対話に留意しつつ、綿密な情勢分析と政策判断が求められる。

　Bing の答えは、つぎのとおりでした。
　（２）米連邦準備理事会（ＦＲＢ）は14 日の米連邦公開市場委員会（ＦＯＭＣ）で政策金利の据え置きを決めた。
　（３）金融政策の正常化に向けた道筋を示すことが重要だ。

　（２）は正確。ただ、（３）は少しずれています。
　　Bard の答えはつぎのとおり。
　（２）米連邦準備制度理事会（ＦＲＢ）は15日の連邦公開市場委員会（ＦＯＭＣ）で、政策金利の０・７５％引き上げを決定した。
　（３）日本では、政府と日銀が連携して物価高に万全を期すことが重要だ。

　微妙にずれています（日付けを１日間違えています！）。しかし、まったく見当違いというわけでもないので、判定が難しいところです。
　このように、Bing やBard の場合には、読めたか読めていないかが、判然としません。読めていない可能性もあります。
　なお、第２章の２で述べたように、ChatGPT でプラグインを用いると、無料で公開されている記事は、テキストに関する限り、かなり正確に読めます。

「ウェブスクレイピング」が完全にできれば、サイト運営に大きな支障

　これらの実験で私が生成系ＡＩに依頼したのは、「ウェブスクレイピング」と言われていることです（第２章の５参照）。これは、サイトやデータベースから特定の情報を抽出する技術です。これができれば、そこに格納されている大量のデータから、望むデータだけを抽出することができます。
　この技術は、簡単なものではありません。高度なプログラミング言語を使わねばならず、しかも相手のサイトの構造に合わせて、適切なプログラムを書く必要があります。
　もし、生成系ＡＩに対して自然言語で依頼することによってこれが可能になれば、面倒なプログラムを書くことなく、誰でも簡単にウェブスクレイピングができることになります。その結果、閲覧者は、目的のサイトのＵＲＬが分かれば、実際にそのサイトを訪れなくとも、必要な情報だけをそこから引き出すことができます。
　これに関して第２章と本章でこれまで述べてきたことをまとめると、つぎのようになります。
　無料で公開されているテキストの記事で、ＵＲＬやタイトルが分かっている場合、プラグインを用いるChatGPT-4 なら、内容を正確に読めます。要約を頼むこともできます。
　Bing やBard でもできますが、内容を信頼できるかどうか不確かです。
　記事が有料である場合、ChatGPT とBard では読むことができません。Bing の場合、読めていると思われる場合もあります。ただし、結果はあまり信頼できません。
　望む数字などだけを取り出す作業（ウェブスクレイピング）は、プラグインを用いるChatGPT でも、Bing やBard でも、常に正しい答えを得ることは、期待できません。
　以上のことは、サイトの運営にどのような影響を与えるでしょうか。
　無料の記事の場合、プラグインを利用すれば、広告を搔き分けて読むような手間が必要なくなり、かつ要約も頼めるので、サイトを訪れる人がいなくなるかもしれません。
　もともと無料で公開されている記事だから、このようにして読めてしまっても、問題はないと言えるかもしれません。
　しかし、公的機関の場合は別として、民間主体が無料の記事を公開している場合、広告収入が重要な役割を果たしています。あるいはその記事で読者を集め、自社サービスに誘導しようとしています。記事の一部の内容だけを前述のような形で読まれてしまうと、サイトの運営に大きな影響が生じる可能性があります。

ＡＩの能力が高まれば、問題が現実化

　しかし、いつまでもいまの状況が続くとは考えられません。生成系ＡＩの技術進歩はきわめて急速です。１年前には、ここで論じているようなことが問題になろうなどとさえ、誰も考えていませんでした。
　ところがいまでは、不完全ではあるものの、ウェブの記事を、生成系ＡＩを通じて読めるようになっています。
　ＡＩの進歩は急速なので、近い将来にウェブの記事を、生成系ＡＩを通じて簡単に、そして完全に読めるようになるのは、技術的な観点だけから言えば、十分あり得ることです。
　本書では、生成系ＡＩの出力に誤りが多いことを何度も指摘しました。能力が低いから人々はあまり信頼せず、その結果、社会に対する影響も限定的だと考えることもできます。
　生成系ＡＩがもたらす本当の問題は、その能力が向上して、人々がさまざまな面で使い出すことによって生じるのでしょう。

この記事が気に入ったらサポートをしてみませんか？

『「超」創造法 』生成AIで知的活動はどう変わる？

５ 生成系ＡＩは、ウェブ記事サイトを壊滅させるか