人工知能チャットボットの近未来

2020年12月3日 20:48

はじめに概要について触れます。そして、アルゴリズムを紹介し、それを踏まえた今後の展望という順に話していき、最後にまとめに入ります。

スライド2

チャットボットとは？について話していきます。チャットボットと聞くと、siriやイライザ、近年だと、日本マイクロソフトの人工知能botりんななどを思い浮かべると思います。その他にもアレクサ、オペレーター型のamazon Lex、ワトソンなども挙げられるかと思います。近年、こういったシステムを企業が積極的に取り入れているのを図より確認することもできます。
しかし、結局チャットボットはとはなんなのか、と聞かれると【会話なのか、お知らせなのか、また、人工知能となにが関係あるのか、といった】漠然なイメージしか浮かばないと思います。
それはチャットボットにも組み合わされたいくつか種類があるからなのです。
まずはチャットボットを大まかに分類して整理していきます。

概要

スライド4

スライド5

まずはチャットボットを大まかに分類して整理していきます。
図のように、まずは大きく4種類に分かれます。タスク型とはユーザーからの特定の要求に対して情報提供するモノであり、非タスク型は、主に雑談を目的としており、話題を深めたり、時に会話の継続を促したりするものである。タスク型はユーザーからの文をキーにして該当する返答を検索するため、比較的簡単であります。
上の人工無能はざっくり言い表した造語で、人工知能が搭載されてないという解釈です。それは、、簡易的なbotなど、低コスト大量生産型仕様です。故に人工知能が搭載されているbotが上位互換であることは言うまでもありません。

スライド6

もう少し具体的な立ち位置を表にしました。日本マイクロソフトのりんなに関してはMicrosoft Azure（アジュール）とbeing（ビング）以外、一部を公開制限しているため、断言はできないのですが、応答パターンを調べたところ、一部がルールパターン型に当てはまる可能性があるので、両方に入れました。

アルゴリズム

スライド7

ここからはアルゴリズムを紹介していき、それをもとにその次に紹介する課題を提示していきます。前回で4種類に分けましたが、いずれにせよチャットボットに欠かせないのが自然言語処理です。これが土台となり、他の領域を決めいきます。自然言語処理には、主に「形態素分析」「構文解析」「意味解析」「文脈解析」があります。タスク型と非タスク型でワード入力法が違います。
形態素解析ではjanomeやメカブを用いた品詞によって単語分割をおこないます。「私はりんなです。」に例があります。

スライド8

人工無能であれば、ここまでで完結ができます。しかし、Siriやりんなのような性能を目指す上では人工知能搭載は欠かせないものとなります。ワードベクターですが、これは領域が曖昧なため、今回は自然言語処理の枠に入れましたが、機械学習を使っているので、人工知能の観点から扱いたいと思います。

スライド9

前に紹介したトークナイザとバイグラムは形態素解析における単語の検索手法として使われます。それがこのように単語一塊か、長さ区分かで解析するやり方であります

スライド10

高性能を求めると、単語の意味解析にも力を入れることで、例えば、左上のように、wordベクターの分散表現を用いて、単語の定義によってベクトル化することで、それがどういう意味を持つのかまでを解析します。
有名な例に左下の女王などがあります。このようにして「女王」という意味を理解できるようになります。これを用いて、右上のように、一文のそれぞれの単語に意味、概念を持たせられます。また、周辺の単語解析のためには、n次元をなるべく低次元に圧縮しつつ、ここで右下のようにskip gram model と言われれ一つの隠れ層をもつニューラルネットワークなどを用いて、実行していくのです。

ほかにも単語の意味理解はスクレイピングなどでビッグデータ処理、解析を行い意味連関を探る手法などもあり、方法は多種多様です。Siriやアレクサもこのような性能までアップデートされています。

今後の展望

スライド11

このように人工知能の存在により、目覚ましい発展を遂げていますが、まだまだ多くの課題があります。「人工知能から考える人と言葉」では1〜7の課題を挙げています。今回は、タスク型、非タスク型両方に共通で期待できるモノとして4番をあげます。先程紹介した自然言語処理アルゴリズムでは主に4つを取り上げ、タスク型、非タスク型における機械学習による一つの意味解析を紹介しましたが、実はこれは一つの文章に対するやりとりに完結されてしまう方法です。タスク型の場合の例をピックアップに載せました。「何それ」に対して「これだよ」と返しています。つまり、会話記憶ができていないので、額面通りの意味しか取らないのです。今回は詳しく例を出すことは割愛しますが、非タスク型でも例えばボット対応のカスタマーサービスでは、会話の転機に対応できず、矛盾が生じた場合、話が元に戻ってしまい、ループを続けてしまう可能性もあります。

スライド12

今後の展望として、近頃、深層核推定や発話の焦点を逐次記録しながら実行していくSinder焦点モデルなどの研究によってそのような課題を克服しようとしています。
そして近頃、以上のような研究を踏まえて期待されるモデルの先駆けとして、Googleがオープンドメインチャットボット meenaを試作開発しました。まだまだ試作段階ではありますが、かなりの精度へ近づけるという事で、今後に期待です。

まとめ

スライド13

この記事が気に入ったらサポートをしてみませんか？