『「超」創造法 』生成AIで知的活動はどう変わる?
『「超」創造法』 生成AIで知的活動はどう変わる?(幻冬舎新書)が9月27日に刊行されました。
これは、第12章の5の全文公開です。
5 生成系AIは、ウェブ記事サイトを壊滅させるか
生成系AIで記事を読めるかどうか実験してみた
生成系AIを使ってウェブの記事を読めるでしょうか。
もしできれば、いちいちサイトを訪れなくても記事を読めるので、閲覧者には非常に便利です。第2章の2で述べたように、記事の要約を作ることを生成系AIに頼むこともできます。こうして情報収集活動が劇的に効率化します。
しかし、著者やサイト運営者の立場からすると、もしこうしたことができると、大問題です。著作権が侵害されることになりますし、サイトを訪れる人がいなくなってしまうからです。
そこで、Bing とBard を用いて実験を行なってみました。
最初は、「現代ビジネス」に公表された私の記事を読めるかどうかの実験です。つぎのように質問します。
(1) 「ChatGPT の成果を左右するプロンプトエンジニアリング、その活用のポイントと課題―まず『何を求めるか』を把握してから」((2) この記事の本文は、つぎの小見出しから始まります。「『プロンプトエンジニアリング』の登場」。これに続く本文の最初の文章は何ですか?
(3)この記事の本文の最後の文章は何ですか?
Bardは、ウェブの記事を読めるようだ
Bing は、(2)、(3)とも、プロンプトエンジニアリングという言葉に関係すること(私の記事には入っていない事項)を適当に並べただけで、とても私の記事を読んだとは思えません。タイトルを読んだだけではないかと疑われます。
ところが、Bard の答えは、つぎのようなものでした。
(2) プロンプトエンジニアリングとは、生成系AIがよりよい結果を出せるように、プロンプトを設計する技術です。
(3) プロンプトエンジニアリングは、生成系AIを活用する上で、重要な技術と言えるでしょう。
(2)、(3)についての正解は、つぎのとおりです。
(2)「プロンプトエンジニアリング」という言葉が見られるようになりました。
(3)プロンプトエンジニアリングの重要な課題でしょう。
Bard の答えは、これと完全に一致しているわけではないので、判断が難しいところです。しかし、「不完全ながら読めている」と考えることができるでしょう。
Bingは、新聞の社説を読める
もう一つ実験しました。今度は、新聞の社説。これは、各社ともインターネットに無料で公開しています。つぎのように問いかけます。
(1) [社説]米利上げ「休止」も物価高対応を万全に( (2)最初の文章を示してください。
(3)最後の文章を示してください。
正解はつぎのとおり。
(2) 米連邦準備理事会(FRB)は14日の米連邦公開市場委員会(FOMC)で政策金利の据え置きを決めた。
(3)市場との対話に留意しつつ、綿密な情勢分析と政策判断が求められる。
Bing の答えは、つぎのとおりでした。
(2) 米連邦準備理事会(FRB)は14 日の米連邦公開市場委員会(FOMC)で政策金利の据え置きを決めた。
(3)金融政策の正常化に向けた道筋を示すことが重要だ。
(2)は正確。ただ、(3)は少しずれています。
Bard の答えはつぎのとおり。
(2) 米連邦準備制度理事会(FRB)は15日の連邦公開市場委員会(FOMC)で、政策金利の0・75%引き上げを決定した。
(3)日本では、政府と日銀が連携して物価高に万全を期すことが重要だ。
微妙にずれています(日付けを1日間違えています!)。しかし、まったく見当違いというわけでもないので、判定が難しいところです。
このように、Bing やBard の場合には、読めたか読めていないかが、判然としません。読めていない可能性もあります。
なお、第2章の2で述べたように、ChatGPT でプラグインを用いると、無料で公開されている記事は、テキストに関する限り、かなり正確に読めます。
「ウェブスクレイピング」が完全にできれば、サイト運営に大きな支障
これらの実験で私が生成系AIに依頼したのは、「ウェブスクレイピング」と言われていることです(第2章の5参照)。これは、サイトやデータベースから特定の情報を抽出する技術です。これができれば、そこに格納されている大量のデータから、望むデータだけを抽出することができます。
この技術は、簡単なものではありません。高度なプログラミング言語を使わねばならず、しかも相手のサイトの構造に合わせて、適切なプログラムを書く必要があります。
もし、生成系AIに対して自然言語で依頼することによってこれが可能になれば、面倒なプログラムを書くことなく、誰でも簡単にウェブスクレイピングができることになります。その結果、閲覧者は、目的のサイトのURLが分かれば、実際にそのサイトを訪れなくとも、必要な情報だけをそこから引き出すことができます。
これに関して第2章と本章でこれまで述べてきたことをまとめると、つぎのようになります。
無料で公開されているテキストの記事で、URLやタイトルが分かっている場合、プラグインを用いるChatGPT-4 なら、内容を正確に読めます。要約を頼むこともできます。
Bing やBard でもできますが、内容を信頼できるかどうか不確かです。
記事が有料である場合、ChatGPT とBard では読むことができません。Bing の場合、読めていると思われる場合もあります。 ただし、結果はあまり信頼できません。
望む数字などだけを取り出す作業(ウェブスクレイピング)は、プラグインを用いるChatGPT でも、Bing やBard でも、常に正しい答えを得ることは、期待できません。
以上のことは、 サイトの運営にどのような影響を与えるでしょうか。
無料の記事の場合、プラグインを利用すれば、広告を搔き分けて読むような手間が必要なくなり、かつ要約も頼めるので、サイトを訪れる人がいなくなるかもしれません。
もともと無料で公開されている記事だから、このようにして読めてしまっても、問題はないと言えるかもしれません。
しかし、公的機関の場合は別として、民間主体が無料の記事を公開している場合、広告収入が重要な役割を果たしています。あるいはその記事で読者を集め、自社サービスに誘導しようとしています。記事の一部の内容だけを前述のような形で読まれてしまうと、サイトの運営に大きな影響が生じる可能性があります。
AIの能力が高まれば、問題が現実化
しかし、いつまでもいまの状況が続くとは考えられません。生成系AIの技術進歩はきわめて急速です。1年前には、ここで論じているようなことが問題になろうなどとさえ、誰も考えていませんでした。
ところがいまでは、不完全ではあるものの、ウェブの記事を、生成系AIを通じて読めるようになっています。
AIの進歩は急速なので、近い将来にウェブの記事を、生成系AIを通じて簡単に、そして完全に読めるようになるのは、技術的な観点だけから言えば、十分あり得ることです。
本書では、生成系AIの出力に誤りが多いことを何度も指摘しました。能力が低いから人々はあまり信頼せず、その結果、社会に対する影響も限定的だと考えることもできます。
生成系AIがもたらす本当の問題は、その能力が向上して、人々がさまざまな面で使い出すことによって生じるのでしょう。
この記事が気に入ったらサポートをしてみませんか?