見出し画像

自然言語処理技術はどう使う?

我が社の事業の一つにデジタル研修があります。その中には、AIと呼ばれるものが「どうして注目されているのか」、「機械(コンピューター)が自ら学習するということがどういう意味を持つのか」、等々について実感して頂けるようなDIY(体験研修)も実施しています。

 その一環で、我々も自分たちで自然言語処理AIを活用したチャットボットを構築しました。しかし、これが中々に難しく。特に日本語は、文節の判断や漢字、カタカナ、ひらがなといった様々な文字種があること等複雑な要素が多いゆえか、他の言語にくらべて開発が遅れています。実際に我々が作ったチャットボットも、会話文の文節、複合語、語句の区切りを中々正しく判別できませんでした……。

 そんな中、リクルートは自然言語処理の新たなライブラリを発表しました。我々が苦戦していた複合語の切り方をユーザーが指定できるみたいです。我々としても導入してみたいライブラリの1つですね。

 https://www.agara.co.jp/article/75886


 先ほどの話題にも出てきましたが、自然言語処理の中でも最も実用化されているのがチャットボットでしょう。今や様々な企業が問い合わせフォームにチャットボットを用いたり、LINEアカウントでチャットボット機能を用いてユーザーの問い合わせを処理したりとユーザーの知りたい情報に、人手をかけることなく、出来るだけナチュラルに答えられるようにしています。
 しかしそのチャットボットも、導入しさえすれば成功する、とも限らないようです。この記事では失敗の典型例をあげてくれています。

  https://ledge.ai/chatbot-failure-patterns/


 チャットボットを用いる際に、「問い合わせの多くは『よくある問い合わせ』であろうから一部をチャットボットで自動化できるのではないか」と思いがちです。しかしそれは電話での問い合わせとチャットボットでの問い合わせが、ほぼ同じような質問、聞き方、使用感でくるという前提で成り立っています。電話とチャットボットでは、たとえ聞きたい内容が同じであっても、問合せの手段が異なるので、必ずしも電話の補完になるとは限らないようです。

 注目されている自然言語処理ですが、実際はまだまだ完璧とは程遠い状態です。チャットボットの他に注目されているものとしてサマリー技術があるのですが、正直まだ「なんちゃってサマリー」レベルです。
そもそもサマリーというのは、人間が実施しても完璧に行うのはかなり難しいと思います(そもそも、何を持って完璧というのか、という議論も必要でしょうし)。そしてそれは人間が演算量に追いついていないことに起因しているわけではありません。一つの事例になりますが、東大入試の英語の第一問は、長年、英文要約です。これは要約することがいかに難しく、そして必要されているかということの東大からのメッセージとも言われています。

 https://ledge.ai/aitn-vol13-report/


 しかし、この記事にもある通り、そもそもAIが出すアウトプットに99%の精度がないとビジネスにならないのでしょうか?たぶんその精度が求められるのは一部の状況でしょう。多くの場合は、自然言語処理技術の活用は、あくまで「手段」であるのではないでしょうか?別にAIに限らず、今注目している「手段」が、自分たちが抱えている問題を打破するための本当に最善策なのでしょうか?この問いは重要ではないかと思います。手段が「AI」であったとしても、問題解決の基本は変わらないのではないでしょうか?「手段」ありきではなく、「きちんと問題を定義するとともに、必要な手段の要件を見極めたうえで、手段を選択する」という事が大切だと思います。我々の研修においても、完璧なチャットボットを作ることは、研修を通じて伝えたいと思っていることを実現する最適な手段と言えるのだろうか?...自分たち自身も、これを肝に命じながらAIに関する研修コンテンツの開発を行っていかなければと思っています。(でも、やっぱりチャットボットの精度は、上げていきたいと思ってしまいますが...)

この記事が気に入ったらサポートをしてみませんか?