見出し画像

『「超」創造法 』生成AIで知的活動はどう変わる?

『「超」創造法』 生成AIで知的活動はどう変わる?(幻冬舎新書)が9月27日に刊行されました。
これは、第12章の5全文公開です。

5 生成系AIは、ウェブ記事サイトを壊滅させるか

生成系AIで記事を読めるかどうか実験してみた

 生成系AIを使ってウェブの記事を読めるでしょうか。
 もしできれば、いちいちサイトを訪れなくても記事を読めるので、閲覧者には非常に便利です。第2章の2で述べたように、記事の要約を作ることを生成系AIに頼むこともできます。こうして情報収集活動が劇的に効率化します。
 しかし、著者やサイト運営者の立場からすると、もしこうしたことができると、大問題です。著作権が侵害されることになりますし、サイトを訪れる人がいなくなってしまうからです。
 そこで、Bing とBard を用いて実験を行なってみました。
 最初は、「現代ビジネス」に公表された私の記事を読めるかどうかの実験です。つぎのように質問します。
 (1) 「ChatGPT の成果を左右するプロンプトエンジニアリング、その活用のポイントと課題―まず『何を求めるか』を把握してから」((2) この記事の本文は、つぎの小見出しから始まります。「『プロンプトエンジニアリング』の登場」。これに続く本文の最初の文章は何ですか?
 (3)この記事の本文の最後の文章は何ですか?

Bardは、ウェブの記事を読めるようだ

 Bing は、(2)、(3)とも、プロンプトエンジニアリングという言葉に関係すること(私の記事には入っていない事項)を適当に並べただけで、とても私の記事を読んだとは思えません。タイトルを読んだだけではないかと疑われます。
 ところが、Bard の答えは、つぎのようなものでした。
 (2) プロンプトエンジニアリングとは、生成系AIがよりよい結果を出せるように、プロンプトを設計する技術です。
 (3) プロンプトエンジニアリングは、生成系AIを活用する上で、重要な技術と言えるでしょう。

 (2)、(3)についての正解は、つぎのとおりです。
 (2)「プロンプトエンジニアリング」という言葉が見られるようになりました。
 (3)プロンプトエンジニアリングの重要な課題でしょう。

 Bard の答えは、これと完全に一致しているわけではないので、判断が難しいところです。しかし、「不完全ながら読めている」と考えることができるでしょう。

Bingは、新聞の社説を読める

 もう一つ実験しました。今度は、新聞の社説。これは、各社ともインターネットに無料で公開しています。つぎのように問いかけます。
 (1) [社説]米利上げ「休止」も物価高対応を万全に( (2)最初の文章を示してください。
  (3)最後の文章を示してください。

 正解はつぎのとおり。
  (2) 米連邦準備理事会(FRB)は14日の米連邦公開市場委員会(FOMC)で政策金利の据え置きを決めた。
  (3)市場との対話に留意しつつ、綿密な情勢分析と政策判断が求められる。

 Bing の答えは、つぎのとおりでした。
 (2) 米連邦準備理事会(FRB)は14 日の米連邦公開市場委員会(FOMC)で政策金利の据え置きを決めた。
 (3)金融政策の正常化に向けた道筋を示すことが重要だ。

 (2)は正確。ただ、(3)は少しずれています。
  Bard の答えはつぎのとおり。
 (2) 米連邦準備制度理事会(FRB)は15日の連邦公開市場委員会(FOMC)で、政策金利の0・75%引き上げを決定した。
 (3)日本では、政府と日銀が連携して物価高に万全を期すことが重要だ。

 微妙にずれています(日付けを1日間違えています!)。しかし、まったく見当違いというわけでもないので、判定が難しいところです。
 このように、Bing やBard の場合には、読めたか読めていないかが、判然としません。読めていない可能性もあります。
 なお、第2章の2で述べたように、ChatGPT でプラグインを用いると、無料で公開されている記事は、テキストに関する限り、かなり正確に読めます。

「ウェブスクレイピング」が完全にできれば、サイト運営に大きな支障

 これらの実験で私が生成系AIに依頼したのは、「ウェブスクレイピング」と言われていることです(第2章の5参照)。これは、サイトやデータベースから特定の情報を抽出する技術です。これができれば、そこに格納されている大量のデータから、望むデータだけを抽出することができます。
 この技術は、簡単なものではありません。高度なプログラミング言語を使わねばならず、しかも相手のサイトの構造に合わせて、適切なプログラムを書く必要があります。
 もし、生成系AIに対して自然言語で依頼することによってこれが可能になれば、面倒なプログラムを書くことなく、誰でも簡単にウェブスクレイピングができることになります。その結果、閲覧者は、目的のサイトのURLが分かれば、実際にそのサイトを訪れなくとも、必要な情報だけをそこから引き出すことができます。
 これに関して第2章と本章でこれまで述べてきたことをまとめると、つぎのようになります。
 無料で公開されているテキストの記事で、URLやタイトルが分かっている場合、プラグインを用いるChatGPT-4 なら、内容を正確に読めます。要約を頼むこともできます。
 Bing やBard でもできますが、内容を信頼できるかどうか不確かです。
 記事が有料である場合、ChatGPT とBard では読むことができません。Bing の場合、読めていると思われる場合もあります。 ただし、結果はあまり信頼できません。
 望む数字などだけを取り出す作業(ウェブスクレイピング)は、プラグインを用いるChatGPT でも、Bing やBard でも、常に正しい答えを得ることは、期待できません。
 以上のことは、 サイトの運営にどのような影響を与えるでしょうか。
 無料の記事の場合、プラグインを利用すれば、広告を搔き分けて読むような手間が必要なくなり、かつ要約も頼めるので、サイトを訪れる人がいなくなるかもしれません。
 もともと無料で公開されている記事だから、このようにして読めてしまっても、問題はないと言えるかもしれません。
 しかし、公的機関の場合は別として、民間主体が無料の記事を公開している場合、広告収入が重要な役割を果たしています。あるいはその記事で読者を集め、自社サービスに誘導しようとしています。記事の一部の内容だけを前述のような形で読まれてしまうと、サイトの運営に大きな影響が生じる可能性があります。

AIの能力が高まれば、問題が現実化

 しかし、いつまでもいまの状況が続くとは考えられません。生成系AIの技術進歩はきわめて急速です。1年前には、ここで論じているようなことが問題になろうなどとさえ、誰も考えていませんでした。
 ところがいまでは、不完全ではあるものの、ウェブの記事を、生成系AIを通じて読めるようになっています。
 AIの進歩は急速なので、近い将来にウェブの記事を、生成系AIを通じて簡単に、そして完全に読めるようになるのは、技術的な観点だけから言えば、十分あり得ることです。
 本書では、生成系AIの出力に誤りが多いことを何度も指摘しました。能力が低いから人々はあまり信頼せず、その結果、社会に対する影響も限定的だと考えることもできます。
 生成系AIがもたらす本当の問題は、その能力が向上して、人々がさまざまな面で使い出すことによって生じるのでしょう。


この記事が気に入ったらサポートをしてみませんか?