見出し画像

GPT-3.5Turboを利用して、クイズ形式応答を行うLINE Bot (複数ジャンル対応型・GPT-4omniへ切替も可)

前回ご紹介したGPT-3.5TurboとDALL-E3とDeepLを同時に使用できるLINE Botを更に応用し、クイズ形式の応答を行うことが出来るLINE BotをGASで作成しました。

DALL-E3の「お絵描き」機能やDeepLを介した英訳機能など、前バージョンに搭載している各種機能もそのまま使用できます。それらの機能については、上のリンクから以前の記事をご参照ください。

尚、今回のバージョンでは前回バージョンに実装していた、トリガーに一致しないあらゆる入力に対して、仮に「A」と返すコードは削除しています。

今バージョンにおいては、その際には何も反応しない形になっています。

初期設定としては算数と漢字に関するクイズを行うプロンプトを組んでいますが、プロンプトのカスタマイズ次第では、別なジャンルのクイズ形式に変更することも出来ます。

実際の使用例は下図のようになります。

上図のように、LINE Bot上で「算数クイズ」または「漢字クイズ」と入力すると、GPT-3.5Turboがランダムに算数と漢字に関するクイズを作成し、送信してきます。

ユーザーがそれに対して返答を行うと、次にGPT-3.5Turboはあらかじめ用意しておいた正解を返信します。

まず始めに、下のリンクからGSSファイルを開き、メニューファイルから「Make a copy」を選択して、ご自身のGoogle Driveにコピーしてください。
https://docs.google.com/spreadsheets/d/1WYzwJOORUn39uVG4wsatZ97KoIS4NgfRRDKYCopR818/edit?usp=sharing

GSSファイルをコピーしたら、下図のようにスクリプトを開いてください。

スクリプトエディタを開いたら、所定の位置にLINEのアクセストークンとOpenAIのAPIキー、DeepLのAPIキーを入力してください。

それだけで、後はデプロイと初回認証を行い、LINE developersのWebhookにリンクさせるだけで使用できます。

DeepLのキーを入力しなくても、英訳機能以外のLINE Bot自体は動作します。
(GPT-3.5Turboとの会話機能の中でも、英訳自体は可能です。トークンは消費しますが)

尚、参考までにmain.gsファイルのコードは下のように作成しております。

main.gs

// LINE Bot 設定
const CHANNEL_ACCESS_TOKEN = 'ここに入力する'; 

// AI設定
const openAIApiKey = "ここに入力する";

//英語翻訳機能を使う為のDEEL API Key
const DEEPL_API_KEY = 'ここに入力する';

const logSheet = SpreadsheetApp.getActiveSpreadsheet().getSheetByName('log');
const DALLE_API = "https://api.openai.com/v1/images/generations";
var replyToken, json;

function doPost(e) {
  json = JSON.parse(e.postData.contents);
  replyToken = json.events[0].replyToken;
  if (typeof replyToken === 'undefined') {
    return;
  }

  // アニメーション効果関数のロード
  const userId = json.events[0].source.userId;
  loadinganimation(userId);

  var userMessage = json.events[0].message.text;
  var messages;

  if (userMessage.includes("こんにちはGPT")) {
    var replyText; // AIからの応答を保存する変数

    if (/こんにちはGPT、.*駅発、.*駅着/.test(userMessage)) {
    // 交通手段と費用に関するプロンプトを作成
    var prompt = userMessage + "前述の合理的な交通手段と費用を算出して1000字以内で出力してください。読みやすいように箇条書きにして、改行してください";
    replyText = getAIChatAnswer(prompt); // 関数を呼び出し、promptを渡す

    }else if (/.*、レシピ/.test(userMessage)) {
    // 交通手段と費用に関するプロンプトを作成
    var prompt = userMessage + "前述の合理的なレシピと予想される費用を概算で良いので算出し、1000字以内で出力してください。読みやすいように箇条書きにして、改行してください";
    replyText = getAIChatAnswer(prompt); // 関数を呼び出し、promptを渡す

    } else {
      // 通常の応答
      replyText = getAIChatAnswer(userMessage); // 関数を呼び出し
    }

    messages = [{'type': 'text', 'text': replyText}]; // LINEメッセージオブジェクトを作成
    
  } else if (userMessage.startsWith("絵を描いて")) {
    // 絵を描くリクエストに対して画像を生成
    messages = getAIImageAnswer(userMessage);
    
  } else if (userMessage.includes("英訳して")) {
    var textToTranslate = userMessage.replace("英訳して", "");
    var translatedText = translateTextWithDeepL(textToTranslate, "EN");
    messages = [{'type': 'text', 'text': translatedText}];
    
  // クイズ機能の追加
  } else if (userMessage.includes("算数クイズ")) {
    const quizPrompt = "ランダムに簡単な算数の問題を1つ生成し、その問題と正確な回答を出してください。必ず問題と解答部分は改行して、分けてください";
    const quizResponse = getAIChatAnswer(quizPrompt);
    const splitResponse = quizResponse.split("\n"); // 仮定: 問題と回答が改行で区切られている
    const question = splitResponse[0];
    const answer = splitResponse.slice(1).join("\n"); // 回答部分が複数行にわたる可能性があるため

    // スクリプトプロパティに回答を保存
    const properties = PropertiesService.getScriptProperties();
    properties.setProperty('quizAnswer', answer);

    messages = [{'type': 'text', 'text': question}];

    // LINEに返信する処理を呼び出す
    const linebotClient = new LineBotSDK.Client({ channelAccessToken: CHANNEL_ACCESS_TOKEN });
    try {
      linebotClient.replyMessage(replyToken, messages);
    } catch (e) {
      log_to_sheet("A", e);
    }
    return; // この処理で返信するため、以降の処理は実行しない
  
  } else if (userMessage.includes("漢字クイズ")) {
    const quizPrompt = "ランダムに漢字の読み書きの問題を1つ生成し、その問題と正確な回答を出してください。必ず問題と解答部分は改行して、分けてください";
    const quizResponse = getAIChatAnswer(quizPrompt);
    const splitResponse = quizResponse.split("\n"); // 仮定: 問題と回答が改行で区切られている
    const question = splitResponse[0];
    const answer = splitResponse.slice(1).join("\n"); // 回答部分が複数行にわたる可能性があるため

    // スクリプトプロパティに回答を保存
    const properties = PropertiesService.getScriptProperties();
    properties.setProperty('quizAnswer', answer);

    messages = [{'type': 'text', 'text': question}];

    // LINEに返信する処理を呼び出す
    const linebotClient = new LineBotSDK.Client({ channelAccessToken: CHANNEL_ACCESS_TOKEN });
    try {
      linebotClient.replyMessage(replyToken, messages);
    } catch (e) {
      log_to_sheet("A", e);
    }
    return; // この処理で返信するため、以降の処理は実行しない
  }

  // ユーザーが何か回答した場合
  else {
    const properties = PropertiesService.getScriptProperties();
    const savedAnswer = properties.getProperty('quizAnswer');
    if (savedAnswer) {
      messages = [{'type': 'text', 'text': `正解は: ${savedAnswer}`}];
      properties.deleteProperty('quizAnswer'); // 回答を表示した後はプロパティを削除

      // LINEに返信する処理を呼び出す
      const linebotClient = new LineBotSDK.Client({ channelAccessToken: CHANNEL_ACCESS_TOKEN });
      try {
        linebotClient.replyMessage(replyToken, messages);
      } catch (e) {
        log_to_sheet("A", e);
      }
      return; // この処理で返信するため、以降の処理は実行しない
    }
  
  }

  const linebotClient = new LineBotSDK.Client({ channelAccessToken: CHANNEL_ACCESS_TOKEN });
  try {
    linebotClient.replyMessage(replyToken, messages);
  } catch (e) {
    log_to_sheet("A", e);
  }
  return ContentService.createTextOutput(JSON.stringify({'content': 'post ok'})).setMimeType(ContentService.MimeType.JSON);
}

//DALL-E3に関する関数
function getAIImageAnswer(text) {
  var imageURL = generateImageURL(text);
  var messages = [
    {'type':'text', 'text': '画像ができました!'},
    {'type':'image', 'originalContentUrl': imageURL, 'previewImageUrl': imageURL}
  ];
  return messages;
}

function generateImageURL(text) {
  var options = {
    "method": "post",
    "headers": {
      "Content-Type": "application/json",
      "Authorization": "Bearer " + openAIApiKey
    },
    "payload": JSON.stringify({
      "prompt": text,
      "model": "dall-e-3",
      "response_format": "url"
    })
  };
  var response = UrlFetchApp.fetch(DALLE_API, options);
  var data = JSON.parse(response.getContentText());
  return data.data[0].url;
}

//GPT-3.5Turboに関する関数
function getAIChatAnswer(prompt, userId) {
  var requestOptions = {
    "method": "post",
    "headers": {
      "Content-Type": "application/json",
      "Authorization": "Bearer " + openAIApiKey
    },
    "payload": JSON.stringify({
      "model": "gpt-3.5-turbo",
      "messages": [
         {"role": "user", "content": prompt}
      ]
    })
  };
  var response = UrlFetchApp.fetch("https://api.openai.com/v1/chat/completions", requestOptions);
  var responseText = response.getContentText();
  var json = JSON.parse(responseText);
  return json.choices[0].message.content.trim();
}

function log_to_sheet(column, text) {
  var lastRow;
  if(logSheet.getRange(column + "1").getValue() == ""){
    lastRow = 0;
  } else if(logSheet.getRange(column + "2").getValue() == ""){
    lastRow = 1;
  } else {
    lastRow = logSheet.getRange(column + "1").getNextDataCell(SpreadsheetApp.Direction.DOWN).getRow();
    if(lastRow >= 1000){
      logSheet.getRange(column + "1:" + column + "1000").clearContent();
      lastRow = 0;
    }
  }
  var putRange = column + String(lastRow + 1);
  logSheet.getRange(putRange).setValue(text);
}



既存の機能に関する解説は割愛しますが、上のコードの中でクイズ応答機能に関する設定は、それぞれ下図の部分で行います。

ここでGPT-3.5Turboに対するプロンプトを指定していますが、技術的な要点としては、GASのScriptProperties機能を使用していることです。

ScriptPropertiesにGPT-3.5Turboが生成した正解の部分だけをバッファとして一時保存し、ユーザーが回答を入力すると、保存された正解が表示される理屈になります。

当初の構想としては、AIに採点してもらうつもりでコードを組んだのですが、実行してみた処、精度が壮絶に悪く、とても実用に耐えないことがわかりました。

その為、次善の策として何とか回答の精度を担保できるアイデアを考えたのですが、最初のプロンプトの時点でGPT-3.5Turboに問題だけでなく正解も生成させ、
(このやり方だと、ほぼ確実な正解が表示される)

それをGAS側で問題の部分と回答の部分を分離し、最初は問題だけを表示させる形にしました。

ここを任意に変更することで、理論上は初期設定である算数と漢字のテスト以外のクイズ形式に変更することも出来るのですが、

GPT-3.5Turboが生成できるクイズは、かなり得意な分野と不得意な分野に分かれるようです。

試しに、日本史の問題なども作らせてみたのですが、相当「変な」問題が出来てしまい、これも実用に耐えるものではありませんでした。

大雑把に、文章系は苦手、数字系は得意...という感じがします。

また、このコードでは「算数クイズ」「漢字クイズ」という文字をトリガーにしていますが、当然この部分もご自身の環境に合わせて、変更することが出来ます。

...

main.gs下部に記述しているgetAIChatAnswer関数を変更する事で、初期設定ではGPT-3.5Turboを使用している設定を、最新のGPT-4omniに切り替えることも可能です。

モデル名は、下図のようにgpt-4o-2024-05-13と入力してください。

モデルをGPT-4omniに変更すると、下図のようにGPT-3.5Turboではとても実用に耐える精度にならなかった日本史のクイズなども、かなり高い精度で実行できるようになります。

但し一つ問題があって、GPT-3.5TurboからGPT-4omniに切り替えた時に、GPT-3.5Turbo用に最適化したプロンプトでは、クイズ機能の応答が正しく動作しない場合があります。

以下に、なるべくGPT-4omniに最適化したバージョンをアップいたしましたので、GPT-4omniへモデルを変更した際に、クイズ機能に支障が出る場合にはこちらを使用してみてください。
https://docs.google.com/spreadsheets/d/1VZb5JU6R8VvShslw0V_I3jeJ8uKJRE6J6wHrh68X3Y4/edit?usp=sharing

上記改良版では、通常版に搭載していない「日本史クイズ」機能も実装しています。

但し、同様にGPT-4omni用に最適化したプロンプトは、GPT-3.5Turboに戻した時に、クイズ機能の応答が正確に動作しない傾向があるようです。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?