見出し画像

【PsyQA】悩み相談もAIの時代?(論文紹介)

今回は、PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Supportという、2021年の論文の紹介をします。

PsyQAは、中国の悩み相談掲示板「壹心理(Yixinli)」の質問と回答を集めた、中国語のデータセットです。この論文では、このデータセットを提案すると同時に、作成したデータセットを用いたAIの学習も試みています。人の回答とAIの回答の比較評価も実施されています。

本記事では、この論文の内容に基づいて、

1.PsyQAって何?
2.どんなことができるの?
3.悩み相談に対して、AIの実力は?

ということを簡単に紹介していきます。

AIは、人の悩み相談に対して、支えになったり適切なアドバイスをしたりすることができるのでしょうか??

PsyQAって?

中国の悩み相談掲示板「壹心理(Yixinli)」の質問と回答を集めたデータセットです。

質問数 22,346、回答数 56,063、となっています。質問数より回答数が多いのは、1つの質問に対して複数の回答が存在するためと思います。

これらは、「壹心理(Yixinli)」という、中国で2011年に設立されたメンタルヘルスサービス専門のプラットフォームに、実際に投稿された質問と回答です。Webクローリングによって収集されています。

質問者は、①タイトル、②質問内容、③キーワード、を記載して投稿します。それに対して、回答者は、想いを受け止めたり、改善策を提示したり、という形で回答します。回答文は比較的長文で、平均500単語程含まれているそうです。

また、PsyQAでは、独自に情報を追加しています。
回答文の各文章に「意図」のラベル付けがされているのです。どういう意図、目的でその文章が存在するのか、ということです。
この「意図」は、カウンセリングの方法論に従って定義されているとのことで、6つに分類されています。具体的には、以下の表の通りです。

6つの意図(論文の内容を基に作成)

どんなことができるの?

主に、2つの用途があります。
①悩み相談に対する回答の傾向分析、②悩み相談に回答するAIの訓練、です。

まず1つ目。悩み相談のQAが揃ったデータセットですので、分析することで様々なことが見えてきます。
例えば、1つの回答の中で「意図」がどう組み立てられているかを図示したものがこちらの図です。

回答文内での「意図」の構成(論文より抜粋)

横軸は左から右へ時間の経過を、色は各意図を表しています。例えば、紫色は「承認し安心感を与える」で、冒頭そこから入る回答文が多いことが見てとれます。
代表的な型がありつつも、質問文に応じて多様な回答が存在することが見て取れます。論文内では他の分析もなされています。ご興味ある方は原著をお読いただければと思います。

続いて、もう1つの用途、このデータを用いたAIの訓練です。
AIの訓練方法の1つに、「教師あり学習」というものがあります。問題と答えをセットで与えて、訓練する方法です(人間と一緒です)

今回の問題設定では、問題と答えは、
問題:質問文(①タイトル、②質問内容、③キーワード)
答え:回答文
になります。これらをAIに与えることで、こういう悩み相談にはこういう風に回答するんだよ、と教えていきます。そうすると、悩み相談の質問文を入力すると回答文を出力するAIが出来るという訳です。

ということで、実際にAIが作成した回答文を見てみましょう。

質問とAIの回答(論文の内容を基に作成)

いかがでしょうか?
と言っても、中国語で出力された文章を、英語を経由して日本語に翻訳しているので、訳わからない感じではありますね…笑
ただ、「悩みを理解していそう」「筋道立てて話そうとしている」「支えになろうとしている」といった印象は持つのではないでしょうか?

ちなみに、AIを訓練する際に、2つのパターンを試しています。
お手本の回答文だけを教える場合と、回答文だけでなく各文章の「意図」も一緒に教える場合です。
どちらがより良い回答をすることができたでしょうか?
もちろん後者です。どう良かったかは、次の章でもう少し説明します。

悩み相談に対して、AIの実力は?

最後に、気になるAIの実力についてです。

本論文では、実際の回答文と、AIの回答文とを比較評価しています。(実際の回答文は、カウンセラーや訓練を受けたボランティアによって投稿されたものです。)

評価するのは、心理学系専攻の大学生です。
以下の4つの観点で3段階(1・2・3)で評価します。
① Fluency(文章が自然か?)
② Coherence(論理的か?)
③ Relevance(質問と関連しているか?)
④ Helpfulness(助けになるか?)

結果がこちらです。

回答文の評価結果(論文の内容を基に作成)

まず、AIの2パターンの訓練方法、「通常訓練」と「意図あり訓練」の比較です。
「意図あり訓練」の方が全体的に評価が高いです。特に改善幅が大きいのは、FluencyとHelpfulnessです。各文章の意図を教えることで、文章が構成立てられ、文章間の繋がりが自然になったり(Fluency)、内容が理解しやすく、より有用なものになったり(Helpfulness)したのかなと推察しています。

続いて、AIと人との比較です。
4指標の平均は、AIが1.6点、人が2.7点です。さすがに人の圧勝でした。
AIの回答文の評価が低かった理由は、2つ挙げられています。1つは、回答文が長文なため、AIのボロが出やすかったということ。もう1つは、評価者が心理学部の学生であったため、助言や分析に関して厳しい評価だったということです。

まとめ

今回は、『PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Support』を紹介しました。

タイトルを「悩み相談もAIの時代?」としていますが、残念ながら(?)、現時点では人の圧倒的勝利で、AIに悩み相談をする時代はまだ先かもしれません。

また、各文章の「意図」を一緒に教えると、AIの回答が良くなるという点は、面白いなと感じました。人に何かを教える場合と同じなんですね。

いかがだったでしょうか?
ワクワクした方もいれば、違和感や嫌悪感を感じた方もいるかもしれないと思います。いずれにせよ、より人がイキイキと生きるために、どんな風にAI技術が使えるか議論がされていくことは大切と感じます。

最後までお読みいただきありがとうございました。
楽しんでいただけたり、何かの参考になりましたら幸いです。

おまけ(あとがき)

本論文を読んで思ったこと、考えたことを2つ書いてみます。

① AIにはAIなりの回答が必要かも?

AIが、人間と同じように回答することに対して、私は違和感を感じました。具体的には、「私の経験談ですが」や「私も以前似たような経験をしていて」といった部分です。「絶対嘘!」と思ってしまいます。
伝聞的な表現を使うとか、自己開示的手法は使わないとか、AIにはAIなりの回答が必要なのかもしれないと思いました。

② 悩み相談掲示板での、AIの他の使い道

悩み相談に対する回答以外で、AIを活用できないか考えてみました。
PsyQAで訓練したAIは、回答文を解析し、「意図」の構成を推定することができます。これを応用できるかもしれません。例えば、ある回答者の複数の回答文を解析することで、回答者に俯瞰的な視点を提示したり、その回答者があまり使わない構成の他の回答者の回答文を提示することで、回答に幅を持たせるサポートをしたり。
他にも、ある質問に対して、質問のトピックや回答者の過去の回答傾向の分析に基づいて、回答者に「この悩み相談に回答してみませんか?」と割り振る(レコメンドする)AIとかも、アリなのかなぁ…と思いました。

最後までお読みいただきありがとうございました!

この記事が気に入ったらサポートをしてみませんか?