ユーザー体験の視点で考える超大規模言語モデルの面白さ

LINE AI事業での取り組みとして、2020年の11月にこんな発表をしました。

NLP(Natural Language Processing)界隈では、話題にして頂いているようなのですが、事業やプロダクト作りに携わっている方々には、その面白さがあまり伝わっていない気がします。

元祖の取り組みとして、去年にOpenAIから発表されたGPT-3が一番有名かと思います。こちらは英語モデルですが、APIが限定的に公開されており、これを活用したアプリケーションのデモもあります。

翻訳や対話Bot、ソースコードの生成、記事生成、ソースコードの生成、ブレストのアイデア出し、キャッチコピーの生成、検索ワードの補完、などなど。

様々なユースケースに対して、1つの汎用言語モデルに適用可能、というのは大規模言語モデルに対するよくある説明です。確かに、ユースケース毎に特化モデルを作る必要がなくなれば、これまで費用対効果が合わなかったロングテールなユースケースにも適用可能となります。

また、この言語モデルの性能は、パラメータ数N、データセットサイズ数D、計算コスト予算C、の3つの変数のべき乗則で決まり、さらに、性能向上に上限が無いかもしれない、という論文がOpenAIから出ています。つまり、この3つの変数を引き上げ、汎用モデルの性能を上げることで、全てのユースケースにおける精度を上げられる可能性があります。

上記のような技術的な観点での凄さや、個別のユースケースについては、英語圏のメディアを中心によく語られています。しかし、技術的に実現可能そうなユースケースだけではなく、ユーザー体験として、どういう価値をもたらすのかは、あまり議論されていないように思います。

未知の領域ですし、今後、変わっていく可能性は多分にありますが、ユーザー体験の観点から面白さについて、現時点で想像できることを書いてみたいと思います。

1. 人のしゃべり相手になる(かもしれない)

汎用モデルですので、あらゆるインプットに対して、言葉としては正しい、それなりの答えを返してくれることが期待できます。

"それなりの"と書いたのは、現時点でのモデルの特性上、歴史的な事象などの静的な事実については、確からしい答えが期待できる一方で、今日の天気だったり時事ニュースだったり、freshnessが要求される出力をするのはまだ難しい、という意味です。

ただ、あらゆるインプットに対して応答できるというのは、それだけで大きな価値です。さらに、その応答のバリエーションについても、過去のやりとりを次の入力に含めることで、単調で決まった応答ではなく、毎回違う応答をすることができるようになります。

いわゆるタスク指向型と呼ばれる、ユーザーからの指示を適切に実行するのが主目的の対話サービスでさえ、"おしゃべり"のニーズは強く存在します。スマートスピーカーなどでも、開始当初に比べれば、おしゃべりのバリエーションは非常に増えたとはいえ、十分ではありません。

この"おしゃべり"ニーズに対して、どんな話題でも会話が成り立ち、バリエーションに富んだ返答ができることで、特定のタスクをこなす依頼相手ではなく、会話自体を楽しめるようになる存在になる可能性があります。

ただ、ユーザー観点では、おしゃべりの相手がいること自体で大きな価値となり得る一方、事業観点では+αのエッセンスが必要になると思います。

いくつかの方向がありますが、その1つの可能性は、メンタルヘルスケアです。

Facebookでは、以前から投稿内容とうつ病の関連性に関する研究がされており、記事にも出ています。日本でも、ブログの発信内容と、うつ病など精神疾患の関連性についての研究があります。

精神医学×メディア解析技術による心の病の定量化 早期発見と社会サービスの創出

SNSの発言ではなく、本言語モデルをベースにした対話AIとの会話により、メンタル面の不調のシグナルを見つけるなどができれば、"楽しいおしゃべり"を超えた価値を提供をできるようになる可能性があります。

2. 人が学びを得る(かもしれない)

この大規模言語モデルは、日本語に関する大量のデータを学習した、ある種の集合知です。その集合知が生成する文章や対話での応答は、未来を予測するものではありません。しかしながら、一方で、過去に生成された文章を基にした、もっとも確からしい内容になると期待できます。

そう考えたとき、これまでのように一意な正しさを引き出すものではなく、アイデアの幅を広げたり新しいアイデアを生み出す、人が学びを得る存在になるかもしれません。

冒頭で書いたブレストのユースケースはまさにそうですね。フラットな立場で、例えば、広告のキャッチコピーを数多く短時間に生成することができます。また、記事のタイトルと初めの数行をインプットとして、残りの文章を生成することもできます。

少し話がそれますが、GPT-3が発表された当初、GPT-3が生成した記事がHacker Newsでトップニュースになったと話題になりました。

言語モデルが生成した文章を、自動生成されたと明かさずにそのまま掲出するのは、非常に大きな問題があります。(この問題については、多くの深いテーマを含んでいるため、ここでの深堀は割愛します)

しかし、言語モデルが生成した様々な文章の構成や内容を参考にし、最終的に人がその事実性や論理性を確認した上で、掲出するのであれば、問題ないでしょう。むしろ、ゼロから自分で文章を作るよりも、普段と違う構成や多彩な表現を含んだ文章を作れるかもしれません。

先ほどのブレストも同じで、短時間で多くのアイデアを生み出すことができます。そのアイデアは、いつも決まったメンバーで行うブレストよりも、幅広いものになる事が期待できます。

GPT-3の面白いユースケースで、クッキーのレシピを作る、というものがありました。

新しいアイデアのほとんどは、既存の要素の組み合わせであると言われています。このクッキーのレシピも同じで、1つ1つの要素自体は今までのものだとしても、それらの異なる組み合わせで新しいアイデアになります。

集合知であるこの言語モデルが、アイデアの幅を広げたり、新しいアイデアを生み出すことで、言語モデルから人が学びを得るようになっていく事が期待できます。

3. 人が相談するようになる(かもしれない)

言語モデルが、人の思考の幅を広げられる存在になった後、次のステップは、人の相談相手になっていくことかもしれません。

例えば、"仕事でうまくいかない事があったんだけどどうしたらいい?"という問いに対して、"まずは落ち着いて深呼吸することです。そして自分自身を信じてみてください。あなたにもできるはずです" という返答をする。
また、次の日にも同じことを聞かれたら、"ちょっと休んで、気分転換をして休んでみたら"と返す。

何のコンテキストもない存在とこのようなやりとりをしても、何も感じないかもしれません。しかし、どんな話題でもそれなりの答えを返し、様々なアイデアを生み出してくれる存在から、上のような返答をされた時、人がどう感じるか。それはまだ未知の領域です。

これを考える1つの例として、Oracle社が実施した調査があります。仕事上の悩みを相談する先として、上司よりもロボット(人ではない存在)の方が、うまく支援できると感じられる、という内容です。

日本を含む11カ国、12,000人調査:82%が、人よりロボットがメンタルヘルスを上手く支援と回答

いきなり、相談相手として提供されても、相談する気にはなれないと思います。

しかし、おしゃべりや新しいアイデアを提供してくれる存在として、日常の関わりの中で、ある種の信頼関係のような感覚(一方的ですが)が生まれていれば、その返答自体に文章としての大きな意味はなくとも、人の思考を促すきっかけを与える存在になり得るのでは、と思います。

まさに、映画のHerの世界ですね。

そして、ここに至るには、もう1つ非常に重要な要素があります。それは倫理性です。差別的なことを返答(生成)しないというのは当然とし、中立性をどう定義し保つのか、など。Ethical AIと呼ばれる事が多いですが、これに対するまだ明確な答えはまだありません。まさに世界的に議論が行われている状況です。

LINE AI事業においても、Trustworthy AIというテーマの元、信頼に足るAIとは何か、どう実現するのかを具体化していこうとしています。

まとめ

サービスの観点で、超大規模言語モデルについて、その面白さを記載しました。一言で言うと、この面白さは、正しいか正しくないかを超えて、人がどう感じるか、に及んでいくことだと思います。

言語モデルが出力した内容から人が学び、何かを相談するようになる。コンピューターと人との関わりが、単なるツールではなく、相互作用の関係になっていく可能性があります。

今回の記事では、以下の3つについて、例を交えながら書いてみました。
1. 人のしゃべり相手になる(かもしれない)
2. 人が学びを得る(かもしれない)
3. 人が相談するようになる(かもしれない)

まだまだ不確実性が高いために、かもしれないとか、なり得る、期待される、可能性がある、など、曖昧な表現が多くなったことお許しください。

最後に宣伝です!

この言語モデルは、ユースケースの幅が非常に広く、アイデアを具体化してことのできるサービス企画担当がまだまだ足りていません。高い不確実性を楽しみながら、これからの人のコンピューターの関わりを創り出していくことができるお仕事です。ご興味があれば、ぜひご応募ください!


この記事が気に入ったらサポートをしてみませんか?