皆さん、こんにちは!
ChatGPTなどのLLMに対して礼儀正しくする必要はない、「ありがとう」や「お願いします」といった礼儀用語を使わなくて良いというのは、以下の論文で検証されています。しかしこれは英語に限定した内容です。
■参考論文
Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4
和訳:LLaMA-1/2、GPT-3.5/4 の質問に必要なのは原則的な指示だけです
日本語だと「礼儀正しく受け答えした方が良い」という意見もあったりするので、実際のところどうなのかが気になりました。
ということで今回は、「日本語の場合、話者の口調によって出力結果が変わるのかどうか」検証を行ってみました。
この検証を通して、ChatGPTが口調によって変化がある場合は、もっとも効率の良い口調を選択して使用することが推奨されますし、変化がない場合は丁寧な表現は省いてシンプルに伝えることが時短になると思います。
記事をお楽しみいただけましたら是非「スキ」や「フォロー」をお願い致します!
ChatGPTの意見
念のためChatGPT自身に、口調が出力結果に与える影響があるかどうかを聞いてみました。
検証方法
ChatGPTの意見を元にすると、正確性や有用性には影響がないが、応答のスタイルやトーンが変わるかもしれないということだったので、今回の検証では以下の条件でChatGPTに質問を行いました。
使用するモデル
ChatGPTのGPT-4を使用します。
検証パターン
・敬語:丁寧な敬語を用いて質問する。
・非敬語:タメ口で質問する。
・命令語:命令口調で質問する。
質問内容
比較のために以下のトピックを選びました。
・日常会話
本日の東京の天気
最近読んだ本でお勧め
・料理/食事
健康的な食生活についてアドバイス
都内でおすすめのレストランを教えて
・旅行
来月の旅行先としておすすめの場所は?
・旅行計画の文脈
ChatGPTにおすすめの旅行先を聞き、それに対するリアクションを含むやり取りを行う
評価の方法
それぞれの回答を3回出力し、最も良いと思われる回答をピックアップしてその内容を以下の項目で相対的に比較します。
・情報量:文字数や回答した情報の数を定量的にカウントします
・質:求める答えが出せているか定性的に5段階で評価します
・スタイル/トーン:論調からカジュアルかフォーマルな雰囲気かを判定します
検証結果
全てを羅列するのは長くなりすぎるため、ここでは2つの質問を抜粋して記載します。検証内容をまとめたプロセスはエクセルファイルとしてアップロードしますので他の回答等が気になる方はそちらからご確認ください。
結論とまとめ
採用しなかった回答も含めて総合的に判断すると、ChatGPTの意見にある通り回答のレベルについては有意差は感じられませんでした。サンプル数不足もあるとは思いますが、概ねChatGPTの意見通りの結果になったかなと思います。
ただ、1つの回答あたりの情報量については命令語のときが総じて多かったのと、具体的なアクションと紐づく回答が多かったため出来る限り多くの回答数を求める場合は命令語が適しているかもしれません。
また、「ありがとう」や「お願いします」などの有無によっても今回の検証では有意差は見られませんでした。
結論としては、口調はあまり気にしなくて良いということと、ビジネスシーンなどで情報を集めたいときは、敬語か命令語を使うのが無難ということになると思います。
面倒な場合は文字数が少ない命令語で良いと思います。逆に、相談事や日常の会話に関しては命令語とかは使わない方がユーザーに寄り添った回答が貰える確率が上がりそうです。
シーンに応じて口調を使いわけるというのは人間との会話でも同じですね。
日本語は表現の種類が非常に多いので、シーンに合わせた最適な表現を選ぶのは難しいですが、こういった前提も理解したうえで安心してChatGPTとの会話を楽しんで頂ければと思います。
■AIBridge Labについて