見出し画像

新対話型AI【Chat GPT】が急拡大,Google独占の検索市場を覆すか

チャットボット(自動会話プログラム)の研究に取り組むOpenAI社(米国・サンフランシスコ)が2022年11月、対話型人工知能(対話型AI)の新しいモデル「Chat GPT」を公開しました。

そして今年1月、Microsoft社が同社に約100億ドル、約1兆3000億円の投資を発表しました。
Chat GPTは、公開から5日間で100万ユーザーを突破、2か月で1億人になったと言います。破格の多額投資に、このモデルへの関心が一気に高まっています。

そしてペンシルバニア大学ウォートン校のMBA(経営学修士)試験では、Chat GPTの回答がMBAの合格レベルに達していたとも伝えられています。

相次ぐ華やかなニュースもあり、AIを駆使したこの対話型人工知能が、今世界を席巻しているグーグルの検索エンジン市場を覆すとまで期待されています。

今や文化基盤の要ともいわれる検索市場に何が起きているのか。
新しい対話型AIのChat GPTの可能性とその限界について探ってみます。

1.Chat GPTとは

Open AI社が開発したChat GPTは、検索エンジンに対話型AIを融合させた検索システムです。
これまで対話型のシステムはチャットボットと言われていました。
「ボット」とはロボットのことで、あらかじめ用意したシナリオに沿って顧客の質問に答えるシナリオ型が主流でした。

そこに近年進歩の著しいAIを導入し、きめ細やかで使いやすいユーザーインターフェイスで急速に普及しているのがAI型のチャットボット=対話型AIです。

Chat GPTはその中でも最新のもので、質問を言葉、テキストで文章形式で入力すると、人工知能を組み込んだコンピュータが応対し自然な会話、文章で答えが戻ってきます。
質問の仕方では、データを一覧表にまとめ、また長文の要約もしてくれます。また報告書や企画書、手紙もまとめてくれるようです。

Chat GPTのトップページ
(下の薄い囲み内に質問を入力します)

まずは実際に利用してみます。
質問を「Chat GPTとはどのようなものか説明してください」と入力した回答が以下の通りです。

【Chat GPT回答】
Chat GPTは、OpenAIが開発した自然言語処理の大規模な言語モデルです。
GPTとは、「Generative Pre-trained Transformer」の略で、トランスフォーマーと呼ばれる深層学習モデルを使用しています。
Chat GPTは、数十億ものトークンから構成される大規模なテキストコーパスを学習しており、それによって自然言語生成、文書生成、会話生成などのタスクを実行できます。
Chat GPTは、文章の意味や文脈を理解し、人間らしい応答を生成することができます。
Chat GPTは、自然言語処理の分野で多くの応用が期待されています。
たとえば、テキスト生成、文章要約、機械翻訳、会話システムなどが挙げられます。また、Chat GPTをベースにしたAIアシスタントやチャットボットが、企業や消費者向けのサービスとしても注目されています。
ーーー

少し分かった気分になりますが、更に難しそうな表現の「数十億ものトークンから構成される大規模なテキストコーパスの説明をしてください」と質問を重ねます。

【Chat GPT回答】
大規模なテキストコーパスは、数十億ものトークン(単語、句、文などの単位)から構成される、膨大な量のテキストデータの集合です。
これらのテキストコーパスは、自然言語処理や機械学習の研究で広く使用されます。
これらのコーパスは、多様な文書から収集されることがあります。
例えば、ニュース記事、ウェブページ、書籍、雑誌、論文、会話、電子メールなどです。コーパスは、一般的な言語や専門用語、ジャンル、文体、言語的変化、表現方法などの様々な側面をカバーすることができます。
これらのテキストコーパスは、自然言語処理の多くのタスクで使用されます。
例えば、機械翻訳、テキスト生成、感情分析、トピックモデリング、単語分散表現の学習などが挙げられます。これらのタスクでは、大規模なコーパスを使用することで、より高い精度や汎用性を達成できることがあります。
ーーー

この二つの質問への回答はいずれも10秒もかかっていません。
説明の正否は別にして、キーワード検索にはない質問のしやすさと、回答の丁寧さがあり、それが理解のしやすさに結びついています。

何より、今評判を集めているのは、どんな質問に対しても、短時間で一貫性のある整った文章で回答してくれることにあります。
これまでのチャットボットとその回答の質のレベルが違うと感じさせます。

これまでの対話型システムは、シナリオ型など開発側が用意したデータのみで回答していたともいえますが、Chat GPTはインターネット全体のデータを駆使しているかのようにも感じさせます。
会話を重ね自らのデータを増やし、より的確な回答を生成するようになります。

Chat GPTの解説にある深層学習モデル、GPTについて少し補足します。
GPTはAIの分野の大規模言語モデルを駆使しています。
これまでの深層学習(ディープラーニング)を使ったAIが、テキスト、画像、音声など個々の目的に応じて学習用データを準備していたのに比べ、大規模言語モデルはインターネットなどの大量のデータで自動学習して原型を作り、それを目的ごとに選択し適用するといいます。

これまでにない広範かつ大量の情報の中から、より的確な情報提供を可能にしています。
これにより教師学習無しで、言語の認識、要約、翻訳、予測、生成ができ、またテキストから画像、ビデオ、3D変換や、プログラムコードの作成など多様なタスク処理が自由にできるようになりました。

大規模言語モデルは、データの量や計算機の能力を増大すればするほど、その精度が上がることも判明しています。現段階ではChat GPTに間違いが多いのですが、今後利用者の拡大でその信頼性が高まるといわれています。

2.OpenAIとは

Chat GPTを開発したOpen AI社につきChat GPT自身は以下のように紹介しています。

質問=Open AIはどんな組織でなにをするのでしょうか
回答=OpenAIは、人工知能の研究、開発、展開を目的とする非営利団体です。2015年にイーロン・マスク氏、サム・アルトマン氏、グレッグ・ブロックマン氏、イライジャ・プラチャー氏、ジョン・ショークリー氏、ワン・ウェンジン氏によって設立されました。
OpenAIは、AIの進歩が人類全体の利益になるように、その技術の安全性や信頼性、公平性、透明性について研究を行い、AIの利用に関する社会的影響についても議論しています。また、AIの研究を進めるために必要なプラットフォームやツールを開発し、研究者や開発者に提供することも行っています。OpenAIは、その活動を非営利団体として行うことで、AI技術の将来的な発展に対する課題に対処することを目的としています。
ーーー

質問=イーロン・マスク氏、サム・アルトマン氏、グレッグ・ブロックマン氏、イライジャ・プラチャー氏、ジョン・ショークリー氏、ワン・ウェンジン氏について教えてください
回答=イーロン・マスク氏は、テスラやスペースXの創設者であり、エンジニア、発明家、起業家として知られています。OpenAIの共同設立者の一人であり、同団体の初代会長を務めていました。

サム・アルトマン氏は、米国の起業家であり、Y Combinatorの元社長でした。彼はOpenAIの共同設立者の一人であり、初代共同CEOを務めていました。

グレッグ・ブロックマン氏は、米国のAI研究者であり、OpenAIの共同設立者の一人で、同団体の初代CTOを務めていました。

イライジャ・プラチャー氏は、米国のAI研究者であり、OpenAIの共同設立者の一人で、同団体の初代CEOを務めていました。

ジョン・ショークリー氏は、米国のAI研究者であり、OpenAIの共同設立者の一人で、同団体の初代CTOを務めていました。

ワン・ウェンジン氏は、米国のAI研究者であり、OpenAIの共同設立者の一人で、同団体の初代CTOを務めていました。彼は現在Googleの研究者として活躍しています。
ーーー

質問=Open AIの研究成果を教えてください
回答=OpenAIは、幅広い分野でのAIの研究に取り組んでおり、多数の成果を出しています。以下に、その一部を紹介します。
①    GPTシリーズ OpenAIは、言語処理の分野で、大規模な自然言語処理モデル「GPT」シリーズを開発しました。
これは、トレーニングデータから自動的に言語パターンを学習し、文章を生成することができる技術です。最新版の「GPT-3」は、膨大な量の文章から自然な文章を生成し、様々な言語処理タスクを実行できるとされています。

②    Dactyl OpenAIは、ロボットの手を使ってルービックキューブを解くことができるようになるように訓練されたAIエージェント「Dactyl」を開発しました。Dactylは、逆運動学の問題を解決することができ、物体をつかむ、移動する、投げるなどのタスクを実行できます。

③    Gym OpenAIは、AIの開発者が強化学習アルゴリズムを簡単に実装できるようにするためのプラットフォーム「Gym」を開発しました。
Gymは、多数の環境を提供し、簡単にカスタマイズできます。これにより、AIエージェントを訓練し、様々なタスクに対処することができます。

④    RoboSumo OpenAIは、二つのロボットが相撲のリングで戦うというゲーム「RoboSumo」を開発しました。これは、強化学習アルゴリズムを訓練するための環境として使われています。RoboSumoは、ロボットの動きを制御するための複雑な物理学モデルを備えています。

⑤    CLIP OpenAIは、画像認識と自然言語処理の両方を実行するAIモデル「CLIP」を開発しました。CLIPは、画像と文章の関係を学習し、様々な画像分類や生成タスクに使用できます。
ーーー

これらは、OpenAIが行ってきた数多くの研究の一部であり、他にも多数の成果があります。

3.これまでの検索市場

検索エンジンが知られるようになったのは、1994年にスタンフォード大学のジェリー・ヤンとデビッド・ファイロが開発した「Yahoo!」でした。
Yahoo!は人手でウェブディレクトリ(カテゴリーごとの分類フォルダ)を作るディレクトリ型の検索エンジンでした。

その後、Webクローラと呼ばれるプログラム(通称・ロボット)でネット上から対象情報を収集するロボット型(全文検索型)が普及し、現在ではGoogleを筆頭にこのロボット型が検索市場の主流となっていました。

Googleの登場は1996年からです。
検索精度が非常に高く、検索窓だけのシンプルで使いやすいユーザーインターフェイスなどで短期間に市場を席巻しました。
しかし、検索ページの上位に関係のないページを組み込ませ、商品販売などで利益を上げようとする動きも活発になりました。
その対策としてGoogleは「ページランク」という手法を開発します。
信頼度の高いサイトからのリンク数でポイントを付加し、情報の質の維持を狙ったものでした。
 
Googleの成功は検索広告でした。
例えばYahoo!JAPANの経営戦略の中心はポータルサイトの運営で、検索は他のサービスに誘導する手段という扱いでした。
それに比べGoogleは検索エンジン自体のBtoB販売に加え、検索結果に基づく広告枠販売のアドワーズなどのシステムでビジネスを展開、大きな売り上げを確保することに成功しました。

Googleを傘下に持つAlphabetの2021年通年の売上は、2576億ドル(約33兆5000億円)との巨額になっています。
2022年になり広告市場が縮小していますが、第4四半期の売上は760億ドル(9兆8800億円)で、検索広告は426億円ドル(5兆5380億円)になり、YouTube広告が80億ドル、他のウェブサイト広告が85億ドルと続きます。
やはり検索広告がGoogleの屋台骨を支えていることがわかります。

4.今後の検索市場

売上が30兆円を超え、市場の90%余りを押さえるGoogleの検索ビジネスは盤石に見えます。そこにChat GPTはどのような影響を与えそうか。
これをまずChat GPTの説明をベースに検討します。

質問=ネットの検索エンジンの市場について教えてください
回答=現在、世界の検索エンジン市場において、Googleが圧倒的なシェアを持っています。2021年に発表された調査によると、Googleの世界シェアは約92%、次いで中国のBaiduが2.3%、MicrosoftのBingが2.2%、Yahooが1.5%、Yandexが0.8%となっています。
ただし、国や地域によっては、Google以外の検索エンジンが強いことがあります。たとえば、中国ではGoogleは使用できず、代わりに中国版のGoogleである「百度」が最も利用されています。また、ロシアではYandexが最も人気のある検索エンジンであり、日本ではYahoo! JapanがGoogleに次いで利用されています。
また、最近では、人工知能を活用した自然言語処理による「対話型検索エンジン」が注目を集めており、Google Assistant、Amazon Alexa、Microsoft Cortana、Apple Siriなどの「デジタルアシスタント」が登場しています。これらのサービスは、ユーザーが質問をすると自然な対話形式で回答を返すことができるため、従来のキーワード検索よりも直感的で使いやすいとされています。
ーーー

質問=検索エンジンの市場規模はどうなっていますか
回答=世界の検索エンジン市場の規模は非常に大きく、2021年には約2,195億ドル(約24兆円)に達すると予測されています。この市場規模は、検索広告による収益が大きく寄与しており、2021年には約1,327億ドル(約14兆円)が検索広告による収益となっています。また、この市場は今後も拡大が見込まれており、2026年には約3,330億ドル(約37兆円)に達すると予測されています。
なお、この市場はGoogleが圧倒的なシェアを持っていることから、Googleの収益の大部分がこの市場から得られているとされています。一方で、Google以外の検索エンジンや、新しい形態の検索サービスの登場により、市場の競争が活発化しているとも言われています。
ーーー

質問=Chat GPTはGoogleを超えるでしょうか
回答=Chat GPTは、Googleの検索エンジンとは異なる種類のAIモデルで、自然言語処理や文章生成などの分野で高い能力を持っています。一方、Googleは検索エンジン市場において圧倒的なシェアを持っており、その位置を簡単に脅かすことは難しいとされています。
ただし、今後AIの技術が進歩し、自然言語処理や文章生成の分野でChat GPTがより高度な能力を発揮することで、Googleとの競争が激化する可能性はあります。また、GoogleもAIの研究・開発に力を入れており、Chat GPTと同等またはそれ以上の能力を持つAIモデルを開発することができるかもしれません。
しかしながら、検索エンジン市場においては、Googleは非常に強固な地位を築いており、検索エンジンの利便性や品質、広告収益に関わる多くの要素がGoogleの優位性を支えています。そのため、Chat GPTがGoogleを超えることは容易ではないと考えられます。
ーーー

質問=世界の検索エンジン市場のシェアをグラフで表示してください
回答=申し訳ありませんが、私はグラフを直接作成する機能を持っていません。しかし、最新のデータに基づいて、2021年12月の世界の検索エンジン市場のシェアを以下に示します。
·     Google:87.38%
·     Bing:6.34%
·     Yahoo!:2.69%
·     Baidu:1.06%
·     Yandex:0.47%
·     その他:2.06%
これらの数字は、さまざまな情報源から集められ、分析されたものです。
ただし、市場の動向は常に変化するため、数か月または数年後には異なる可能性があります。
ーーー

上記のGoogleシェア「87.38%」は先ほどの検索市場への質問への回答「約92%」と異なります。他のエンジンの数値も異なります。
恐らく出典資料の違いによるものですが、この確認が至難です。
これがChat GPTの現段階の弱みでもあります。

Chat GPTが回答できなかった、検索エンジンのシェア推移のグラフの一例は以下の通りです。

総務省の2022年版 情報通信白書より

この表でも、Googleが 近年フェイク情報の氾濫などで、利用が落ちていることが分かります。

世界の検索市場

世界における検索エンジン市場は、2022年グーグルが85.6%を占め、Bingは8%弱に過ぎないません。しかしChat GPTをはじめ今後の対話型AIの普及で、Google寡占の検索市場の今後が少し不透明にもなってきました。

MicrosoftはChat GPTを開発したOpenAIに2019年に10億ドルを投資し、協業関係を深めてきましたが、新たに約100億ドル(約1兆3000億円)を今後数年で投資すると報じられています。
同社は検索エンジンのBingにChat GPTの発展型モデルを採用すると発表しています。

Bingとは

Bingは、Microsoft Edgeにおけるデフォルトの検索エンジンです。
Bingの基盤のBingAIはChat GPTと同様、大規模言語モデルを使い、自然な文章での応答を可能にしています。

Chat GPTは学習したデータをもとにした応答であり、分野によって得手不得手が目立ち、最新情報にも弱さがある、とも言われています。

新しいBingではChatGPTで使われていたモデルの発展版が組み込まれ、リアルタイムで検索した情報を表示できるようになり、それが強みになりそうです(※)。

(※これまでの対話型AIに用いられているAIモデルは、情報内容をアップデートする都度、膨大な文章内容を読み込み直す必要がありました。新しいBingはウェブ検索を併用し、情報の同時性、正確さを大きく改良したといわれています)。

GoogleはこれまでLaMDAというチャットポットに取り組んでできましたが、Chat GPTの爆発的人気に対応すべく、新たに会話型AIのBardを開発しています。
このモデルは、回答とともにその根拠としたウェブぺージへのリンクも表示され、今の会話型の弱点の信頼性の補填も考えられているといいます。

5.Microsoftの市場インパクト

Bing対Bard。
ネット検索市場の二大ビックの争いは一層激化しそうです。
これまでの検索市場は、Googleが90%を超える圧勝でした。
しかし、対話型AI市場では、Microsoftは無視できない強みも持っています。
 
先ずMicrosoftの市場投資が先行していることです。
先ほども触れましたが2019年に同社はOpenAIに10億ドルを投資、そしてこの1月には100億ドルと巨額をつぎ込んでいます。

大量のテキストなどデータを事前に読み込ませる対話型AIは、コンテンツ制作に検索エンジンにはない多額の費用が掛かるといわれています。

同時にこれまでの検索広告というドル箱にダメージも与えます。
それを振りきって敢えて多額の先行投資をしているマイクロソフトには、今回こそGoogleに勝つという意欲を感じます。
 
Microsoftの強みは、Windowsなど同社のソフトが世界中のパソコンで広く使われていることです。
BingはMicrosoftのブラウザー「Edge」とセットの検索エンジンです。

ブラウザー市場でEdgeのシェアは11%とまだ小さいのですが、検索エンジン市場でのBingの7%ほどと比べれば、足場は強いといえます。
そしてEdgeの強みは、ITやネットの専門家、関係者に評価が高いということです。

Microsoftは専門家への強みを活かし、世界に多くの顧客企業を抱えています。
顧客企業、そしてそこの専門家、関係者の持つ豊富なデータを同社の巨大言語モデルに取り込み、企業により最適な情報を提供する。
同時に対話型AIの新たな市場も開拓する。ここにMicrosoftの戦略があるようで、対話型AIでのGoogleへの雪辱を狙っています。

なお対話型AIへの参入は中国でも動き出しました。
検索最大手の百度(バイドゥ)は2023年3月に対話型AIサービスを開始します。検索シェア2位の「捜狗」をグループに持つ騰訊控股(テンセント)も開発を進めていると報じられています。

中国では当局が制御できない欧米のサービスは使用できません。
そのためChat GPTも利用が不可で、当局の監視が効き、その上利便性の高い独自のモデル開発ができるかどうかが、普及のカギとなりそうです。

6.対話型AIの可能性

古代、ソクラテスの対話が、哲学の基本になったように、対話は人の知識吸収の基本かもしれません。
人工知能の第一人者といわれる東京大学の松尾豊教授は、「キーワード検索が該当項目の資料を示し読んで置いて、というのに対し、対話型は話で説明してくれるようなもの」だと例示し、対話型の親しみやすさと今後大きく普及する可能性を説明しています。

これまでのキーワード検索の限界であった、検索言語の選択の難しさも、AIの助けで探したい事項のニュアンスを言語化することができ、最適情報を見つけられるようになります。

対話は双方向で大量な情報を交換します。
そのためにここには個人個人の趣味、嗜好から仕事、生活情報など極めて大量の情報が蓄えられ、これまでとはレベルの違った精度のマーケッティングも可能になります。

今後、Chat GPTを使ったビジネスが急拡大していくと見られますが、テキストに画像も合わせ、そこに関連する顧客や市場データを加えて広告を生成するビジネスもすでに始まっているようです。

2023年2月のニュースでは、Chat GPTを使った出版が広まっているとも報じられました。
真偽が確認できないのでノンフィクションには向かないようですが、小説や自己啓発書、児童書など、Chat GPTを使った電子書籍が3月半ば時点で200冊を超え、販売されているようです。

対話型は汎用性が大きく、あらゆる産業、文化の分野に適用されていくはずです。今後世界中の会話が蓄積され、日々情報の内容が豊かにそして正確になっていきます。

そうなれば、これまでの検索エンジン市場を超える対話型市場は、広告だけをとっても従来のレベルを超えた大きな規模になる可能性を秘めています。

7.対話型AIの限界

大きな可能性を秘めた対話型AIの根本的な限界も指摘されています。主なものを以下に記します。

常識に欠ける

今の対話型AIは、扱う言語の意味や概念、物事の因果関係を理解していません。相互の関係性を把握できないために、簡単な事実認識、例えば兄弟関係などでも間違いを招くといわれます。

これは使われている言語モデルが機械型のAIで、言語は単語や文節の並び方の特性を捉えて対応しているためです。
機会が膨大な過去の文章を読み込み、並び方のパターンを認識し、そのパターンの出現する確率をはじき出せるようにしているのです。

質問である言葉が出ると、その言葉に続く確率の高い言葉を引き出し、文章を生成する。これが基本になります。
ここでは単語や文節の意味や、単語同士の関係、例えば兄弟関係などの常識や言葉の繋がりなどの論理性は含まれていないのです。

このことから既存の対話型AIは、論理が苦手で、計算も間違いが多いといいます。

このため今、対話型AIの開発現場では、人間の子供が言語や社会の関係を学び、身に着けていく過程を参考に、常識や論理性をコンピュータに学習させる研究、深層学習の開発が精力的に進められています。

Chat GPTなど対話型AIは、大変流暢なコミュニケーションを実現させつつありますが、AIが人間の知能を超えるシンギュラリティ―(特異点)はまだまだ視野に入らず、今は「犬や猫の知能にも及ばない」レベルだといわれています。

ウソが見抜けない

Chat GPTは事案の真偽の判断がつかず、簡単にウソの情報を生成します。
Chat GPTのアルゴリズム(問題解決や、目標を達成するための計算方法や処理方法。プログラムに組み込んだ一定の計算手順や処理方法)は、事実やデータベースの情報を点検し使うわけではないのです。

先に述べたように真偽を問わず、トレーニングデータにあるものに統計的に処理して言葉を生成しています。そのため正確さに欠け、あるいは間違った内容の文章をまとめてしまいます。

8.検閲フィルター

会話型AIはその使い勝手の良さから、利用者個人の趣味や嗜好、考え方まで多くの情報がやり取りされます。それらはこれまでの検索エンジンの情報蓄積よりはるかに密度の濃いものになるはずです。

ここに関心を示すのは、ビジネス企業だけでなく、権威主義の国家や大企業など権力組織、も参画しそうです。
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 
対話型AIはネット上からの情報を選択し、利用者の問に答えるのですが、AIによる選択とはいえ、ある方向性、フィルタリングなどがかけられるリスクも指摘されています。
 
2023年2月に取り上げられたケースが、中国版Chat GPTと称され中国のAIチャットサービス「Chat Yuan」です。
Taiwan Newsによると、中国のAIテクノロジー企業のYuan YuはChat Yuanのサービスを開始しましたが、公開3日で中断になりました。ネットでは、中国政府の見解と異なるトピックが表示されたためだと説明されています。
 
例えば、Chat Yuanはウクライナへのロシアの軍事行動につき「ロシアの侵略戦争とみなせる」と表示、「戦争の根本的原因が米国にある」という中国メディアとの違いがあったといいます。
中国経済も成長率低下や環境汚染などの課題を示し、「堅調な基礎を築いている」という政府の基本姿勢に準じない説明もあったといいます。

短期の公開中止はこれら中国政府との見解の不一致が停止の原因になった、との見方が強まっています。
一方で習近平総書記については、その資質も含め、否定的な表記がまったく見られないと指摘されています。
 
このような公開の中止や内容のチェックは、言論統制のリスクをはらんでいます。
無論、これまでもインターネット上ではヘイトスピーチや人種などへの差別を防ぐためにフィルター機能は利用されていました。
しかし今後Chat GPTなどの普及に伴い対話型AIの媒体力が増していくだけに、政府や国家機関などの検閲介入が、重要な問題になりそうです。

株式会社myコンサルティング
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
2023©️My Consulting Co.,Ltd

この記事が気に入ったらサポートをしてみませんか?