見出し画像

対話するAIの歴史:チャットボットからアシスタントへ

本記事は、対話するAIアプリケーションとしてのチャットボットからバーチャルアシスタントに至る歴史に関する記事です。



初めに

AI(人工知能)の具体的なアプリケーションとしてチャットボットを思いうべる方も多いかと思います。ECサイトにおけるチャットボットでのカスタマーサポートも見かけることが増え、我々の日常生活の中におけるデジタルサービスとして普及しつつあります。また、Google Assistantや、Amazon Alexaは、音声でのチャットボットとしても評価されているバーチャルアシスタントです。現在、そんな(バーチャルアシスタントを含む)チャットボットは様々な業界において多様なユースケースで利用されています。今回はそんなチャットボットの歴史を振り返ってみようと思います。


チャットボットとは

チャットボットという語は、Michael Mauldinによって1994年に造られた用語で、「対話(chat)」する「ロボット(bot)」という2つの言葉が組み合わされています。ユーザーとシステムをつなぐ対話型のインタフェースを介し、コンピューターがユーザーの入力に対して自動応答を行うことで、情報やサービスを提供するプログラムのことを指します。

現在、チャットボットは、ECサイトにおけるユーザーの商品検索の手伝いから、ホテルの宿泊予約のスムーズな手配、社内業務システムにおけるビジネスプロセスの支援、バーチャルアシスタントとして天気や交通情報の提供等、幅広い用途で活用されています。テキスト入力でのインタラクションが基本ですが、SiriやAlexaのような音声ベースのアプリケーションやAIスピーカーも活用されるようになってきました。


ELIZA(イライザ): チャットボットの起源

そんなチャットボットですが、その歴史は、今から65年ほど前の1966年にMITのJoseph Weizenbaum教授によって作られたELIZA(イライザ)から始まります。

ELIZAは、ユーザーが入力した言葉をコンピュータに渡し、スクリプトで用意された回答候補のリストとペアリングして、応答を返すというプログラムでした。基本はパターンマッチングと語句の置き換えによって用いて会話をシュレミートし、カウンセラーの会話を模倣するように見せていたに過ぎませんでした。ですが、スクリプトは、臨床心理学者 Carl Rogersの来談者中心療法の会話手法をベースとしており、それゆえに、非常にリアリティのあるものでした。

以下は、ELIZA を紹介した動画です。


動画内では、まるで人が考えた上で反応しているように見えるという驚きも紹介されています。ELIZAは、あくまでカウンセラーの応答を模倣したプログラムでした。ですが、Joseph Weizenbaum教授はユーザーの反応に悩まされました。ユーザーがELIZAをカウンセラーとして信頼するようになり、個人的な悩みや考え、秘密をELIZAに打ち上げるようになったのです。それほどまでに、Weizenbaum教授の応答モデルは効果的でした。ですが、彼自身は、コンピューターが人間の知性にとって代わるということに否定的で、あくまでも特定の文脈の中において機能する、人間の心の延長線上に位置づけられる道具にすぎないというのが彼の主張でありました。

ですが、ELIZAが示したインパクトはその後のチャットボットのベースとなり、教授の応答モデルを発展させた形で人間に近いインタラクションが追求されていきました。


完全に余談になりますが、東大 松尾研究室からスピンアウトしたAIスタートアップ ELYZAは、このELIZAにちなんで名前をつけられているのかなと推測します。


PARRY(パリー):より人間的に。そして、チャットボット同士の会話

PARRY(パリー)は、1972年にスタンフォード大学の精神科医 Kenneth Colby によって作られました。

ELIZA が来談者中心療法のカウンセラーを模したものであったのに対して、PARRYは偏執病的統合失調症患者の振る舞いを概念、観念、信念(観念に対する判断:受容、拒絶、中立)に基づいて粗くモデル化し、その会話をシミュレートして治療に役立てようという意図で設計されていました。その応答はELIZAに加え、より人間的リアルさをもっており、感情的な傾向・態度を持ったELIZAと称されました。

コンピューターの黎明期を作った Alan Turing が提唱したコンピューターが「人間的」かどうかを判定するためのテストする「チューリングテスト」という概念があります。PARRYに対して、1970年代初頭にチューリング・テストの一種に位置づけられるテストが行われ、実際の患者とPARRYが応答したそれぞれの会話の記録を、33人の精神科医のグループが判定しました。どの会話が人間の患者に寄るもので、どの会話がコンピュータプログラム PARRYによるものかを識別したわけですが、精神科医たちは、正確に人間の患者の会話を見分けれたケースは48%に留まるという結果になりました。これはほぼ無作為の推測と同じであり、コンピューターによる応答プログラムのもつ可能性を示したわけです。

PARRYにはもう一つ特徴的なエピソードがあります。それは、Doctorとも呼ばれたカウンセラーであるELIZAとの対話です。PARRYとELIZAは、何度か直接会話をしたことがあり、そのスクリプトが残っています。会話はプログラム同士の平行線的なやりとりでもあるのですが、そこには興味深い情緒を感じることもできるかなと思います。

以下は、 PARRY と ELIZA (Doctor)の間で行われた会話の記録で、これは、1972年9月18日に行われたものです。


この会話の記録を読んだとき、私は、手塚治虫の傑作「火の鳥」を思い出しました。「火の鳥」の「未来編」の中で、都市のマザーコンピューター同士がディベートをし、議論が平行線となって、とんでもない展開に突入してしまうシーンがあります。それが描かれたのは1967年のことで、タイミング的にはELIZAが造られてすぐであり、そして、PARRYとの会話がまだ存在しえないときでした。そんな時にもうコンピュータープログラム同士の会話を描写した手塚治虫氏の想像力は驚嘆すべきものかなと思います。


Jabberwacky(ジャバワッキー): コンテキストアウェアに、そしてインターネットへ

それから十数年が経過した1988年、Jabberwacky(ジャバワッキー)というチャットボットが登場します。 Rollo Carpenter によって開発されました。ELIZAやPARRYのような、カウンセリングや心療内科という特定の領域ではなく、人間の自然な会話を快活にシミュレーションするということを目的として設計されました。

技術的な詳細は明らかになっていませんが、1990年代に普及したエキスパートシステムとは異なる機構で、文脈に対応し、またその場でのやり取りから相手の語彙を学習し(記憶し)、自分の語彙として用いるということができました。その場の会話を生み出すという機能は、ある種、コンテキストアウェアシステムを志向したものとも言えるでしょう。

Jabberwacky はその後、1997年にインターネット上で使うことができるようになりました。チャットボットがインターネットと出会い、広くユーザーに使われていく時代に入っていきます。


Dr. Sbaitso(スベイツォ):音声合成で喋り出す

Dr. Sbaitso(スベイツォ)は、1992年にシンガポールのCreative Labs社がMS-Dos用に制作したチャットボットです。


心理学者のように振る舞いつつ応答をしていくところは、ELIZAのコンセプトとあまり変わらないのですが、ELIZAに比べるとむしろ複雑なやり取りに対応できていないような感じではあります。新しい点としては、音声合成で喋ったというところです。これはかえって人間らしさを感じさせず、機械としての知性という印象を抱かせるものになったかなと思います。


A.L.I.C.E.:チャットボットと人間の交流

A.L.I.C.E.は、ELIZAに触発され、1995年に Richard Walleceが開発を開始したチャットボットです。Artificial Linguistic Internet Computer Entity を意味する名前になっています。1998年にJavaで書き直され、その後、オープンソース化されました。人工知能の会話ルールを記述するAIML(artificial intelligence markup language)というXMLスキーマを使用する等、意欲的な試みを行いました。


基本的には会話を楽しむために設計されたものであり、特定の領域の問題解決を志向したものではない(すなわち、目的をもたない)のですが、それがゆえに、コンピューターとの心の交流を想像させる向きもあったようです。「マルコヴィッチの穴」を撮った映画監督のSpike Jonzeは、10年以上前このALICEにインスパイアされて、映画「her」を制作したとインタビューで語っています。


SmarterChild: 現代の商業利用への道を開拓する

SmarterChildは、2001年にActiveBuddy社によって開発されました。AIM(AOL Instant Messanger)やMSN Messenger で利用できたことから、幅広く普及し、3000万以上のユーザーに使われるようになりました。様々なサービスやデータベースへとアクセスし、情報提供ができることが特徴で、 ニュース、天気、株式情報、映画の上映時間、イエローページのリスト、スポーツの詳細情報等の他、パーソナルアシスタント、電卓、翻訳機としても機能しました。また、SmarterChild は広告宣伝用のマーケティングツールとしても使われ、SmarterChildをベースとしたアーティスト、ミュージシャンや映画キャラクターに扮した様々なボットが生み出されました。チャットボットの商業利用への道を拓いたといえます。


IBM Watson: 膨大な知識探索を実現。ビジネスチャットボットの標準にも

そして、ここからは馴染みの名前も登場してきます。IBM Watsonです。元来は、米国の人気クイズ番組「Jeopardy!」で勝利することを目標とした質疑応答システムでした。問題文の自然言語を適切に理解した上で、約100万冊のテキストに相当する膨大な情報の中から適切な回答を探索し、選択して答える独立した(インターネットに接続していない)人工知能およびデータベースとして開発されました。

2011年、Watsonは見事Jeopardy! で優勝し、100万ドルの賞金を獲得。コンピューターサイエンスの技術の一つの到達点を示しました。


その後、これらの情報処理技術をベースにWatsonは照会応答、知識探索を中心とした業務プロセスを自動化していくものとして商用化されていきました。その中で、チャットボットとしてのインタフェースやテンプレートも提供されて様々な企業のシステムに導入され、ビジネスチャットボットのスタンダードの一つとなりました。


Siri:音声認識によるアシスタントのパイオニア

Siriです。2011年に iPhone 4Sに組み込まれた自然言語を解するインテリジェントなAIボットです。Speech Interpretation and Recognition Interface という名前が示すとおり、音声認識による応答を行うインタフェースを有したバーチャルアシスタントという領域を切り拓きました。
音声認識の歴史に関しては以前、書いた記事もご確認ください。


Siriは、バーチャルアシスタントとして、インターネットとの接続や様々なアプリケーションとの連携を通し、情報検索、天気予報、経路検索、株式情報、メール、音楽、時計、カレンダー、アラーム、タイマー、電卓、機械翻訳、リマインダー、電話の発信・着信通知の読み上げ等、多様なサポート機能を実現しています。


様々な機能に関しては既に、SmarterChild が実現していましたが、それを音声認識によるインタフェースをもって実現したことが衝撃的でした。Siriは、スタンフォード大学からスピンアウトした、世界でも有数の研究機関の一つであるSRI International (スタンフォード研究所インターナショナル)によって開発されたのですが、元々はDARPA(アメリカ国防高等研究計画局)による戦場の兵士をサポートするための人工知能開発プロジェクトCALOがその源流でした。巨額の資金が投じられ名だたる大学や研究機関から研究者が集められたプロジェクトでもあり、それもあってこのSiriという副産物が生まれ、AIとの対話が音声という世界でブレークスルーする展開へとつながったのです。


Google Now / Google Assistant:より能動的なアシスタント

AppleのSiriに対し、Googleはバーチャルアシスタントとして、2012年にGoogle Nowをリリースしました。

Google NowはGoogle検索アプリケーションの一部として実装されています。今までのチャットボットを含め、多くのアプリケーションがユーザーのアクション、問い合わせを起点とした受動的な起動とそれに対する応答としての情報提供やサービスであったことに対し、Google Nowは場所や時間帯というコンテキストを踏まえつつ、ユーザーがデバイス上で繰り返している行動(繰り返し行く場所、繰り返している予定、検索キーワード、Gmailアカウントに送られるEC業者のメール等)を認識することで能動的に情報を提供することができます。このシステムはGoogleのナレッジグラフというユーザーの意味と繋がりを分析することでより詳細な検索結果を生成するときに使用されるシステムを活用しています。

2017年にGoogle Nowは、Google Assistantに引き継がれています。


後述のAmazonのAlexaとともに、AIスピーカーとしても幅広く使われています。最近は、プライバシー保護への気運の強まりに配慮し、やりとりを記録しない「Guest Mode」を導入しています。


Cortana:最新のWindowsアシスタント

本記事では取り上げなかったのですが、ユーザーアシスタントの歴史を振り返ったとき、Office97やOffice 2000に搭載されたOfficeアシスタントたち、例えば、イルカのKyleを覚えている方もいるかもしれません。(以下の動画はOffice97のアシスタントなので、Office2000に比べると古い感じですが。)


Cortanaは、SiriやGoogle Assistantに対するMicrosoftとしての回答として理解されますが、もしかしたらOfficeアシスタントの直系と捉えたほうがいいのかもしれません。Cortanaは、次世代のあるべきWindows アシスタントとして開発がスタートしました。MicrosoftのBuild 2014で初めてデモンストレーションされ、Windows phoneデバイスやWindows 10に組み込まれました。


Siri、Google Assistantと同様の音声インタフェースを有したアシスタントです。検索ボックスに質問を入力するか、マイクを選択してCortanaに話しかけることでSiriやGoogle Assistant等の他のアシスタントと同様の機能やサービス連携を使用することができます。何を話せばいいのかわからない場合は、ロック画面に候補が表示されるほか、タスクバーの検索ボックスを選択すると、Cortanaのホーム画面にも候補が提示されます。

ちなみに、Cortana の名前は、Microsoft のFPSゲーム「HALO」に登場する人工知能からつけられています。


Alexa: AIスピーカーの定番、スキルによる拡張

そして、ご存知のAlexaです。Alexaは、Amazonが開発したインテリジェントバーチャルアシスタントです。2014年に登場し、現在では「Amazon Echo」「Echo Dot」「Echo Show」等のデバイスに組み込まれています。


Alexa という名前は、ローマ帝国時代に存在して学術・文化の中心であった、古典古代世界最大のアレクサンドリア図書館を連想させるという意見もあるそうですが、実際はそこから名付けられたのではなく、発音しやすい音を持つ単語の選択の中から選ばれたそうです。

Alexaは、AIスピーカーとしてのポジションを確立しています。他のアシスタントと同様に各種機能やサービス連携が多彩で、情報検索、音楽再生、ToDoリストや買い物リストの作成、アラームの設定、ポッドキャストの再生、オーディオブックの再生、ニュースや天気予報の取得、スマートホーム製品の操作等ができます。

以下の動画では、Alexaが単体だけでなく家中のAlexaが連携して動作する等、そのアドバンスドな機能も紹介されています。


そして、Alexa は、進化していくバーチャルアシスタントのプラットフォームでもあります。Amazonは、サードパーティーにASK(Amazon Skill Kit)を公開しており、ゲームやオーディオ機能等の「スキル」(追加機能。アプリのようなもの)の開発をプロモートしています。


ユーザーは、サードパーティが開発したスキルの中から好きなものを選択してインストールすることで、Alexaの機能を拡張することができます。

また、Amazonは、2015年、音声制御スキルとテクノロジーを開発する企業に投資するプログラム Alexa Fundを創設し、2016年には技術を進歩させるためのAlexa 賞を発表する等、バーチャルアシスタントの進化促進に力を入れています。


終わりに

以上、65年にも及ぶチャットボットからバーチャルアシスタントへと至る歴史を概観しました。

65年前のテキストでのELIZAによるやり取りから始まり、対話型のチャットボット、そしてバーチャルアシスタントを実現するコンピューター技術は長足の進歩を遂げました。音声認識、インターネット、AI、クラウド、ビッグデータ、データサイエンス、ソーシャルネットワーク、ロボティクスIoT。現代は、新しい技術トレンドの登場とその普及が息をつかせぬほど目まぐるしく展開しています。そして、これからもコンピューターは進化を続けることでしょう。そのような激動の流れの中で、コンピューターと人のインタラクション、交流がどのように育ち、その関係が変化していくのか。今後の発展からも目が離せません。


おまけ

同様の記事として、ここ十数年に渡るデータベースの進化、50年近くに渡るオープンソースの歴史を概観する記事も書いています。こちらもご覧ください。


この記事が参加している募集

名前の由来

この記事が気に入ったらサポートをしてみませんか?