ChatGPTにコーディングさせてみた⑨ チャットボット作成

はじめに

前回、ChatGPTのように会話の文脈を追って返答することができるチャットボットを作成しました。その後、英会話練習用にプロンプトをセッティングし直して英会話練習専用のチャットボットを作成しましたが、なかなかうまくいきませんでした。というのも、アレクサ自身の音声理解力がそこまで高くないみたいなのです。
基本的にアレクサに話すときは、簡単な指示のみであり、会話を前提としないことが多いです。例えば「アレクサ、音楽かけて」や「アレクサ、電気消して」など。なのでそこまで高い音声処理力は必要ないし、備わっていないんじゃないかと思います。あくまで僕の推測ではありますが、、、

ということでその言語処理の部分をOpenAI社のWhisperで代替できればアレクサを通じて、詳細な会話を実現できるのではないかと考えております。

※ちなみにWhisperとは音声データを文字起こししてくれるOpenAI社の音声認識モデルのことを指します。

ChatGPTに質問

さっそくですがChatGPTに質問していきましょう。

質問

質問してみて1つわかったことがあります。
ChatGPTには2021年9月までの知識しかないので、”Whisper”に関しての見識が全くないのです。
しかし、それでもなお回答しようしてくれるChatGPTには尊敬の念すら感じます。

ChatGPTの回答

ただしこれでは対応できそうにないですね。今回ばかりは自力で調べてコーディングするしかないみたいです。

結局、、、

日本語のみならず英語でも様々なリサーチをかけてみましたが、アレクサにOpenAI社のWhisperを搭載することは無理みたいです。
理由はAlexa Skills Kitが、開発者がAlexaデバイスから直接的な音声ストリームデータへのアクセスを行うことを許可しないためです。つまり、ユーザーがAlexaデバイスに向かって発話した生の音声データを、アレクサが直接受け取って処理することはできないのです。

最後に

今回は不甲斐ない内容になってしまい申し訳ないです。しかし、そもそもアレクサスキルというアプリケーションでできる範囲はかなり狭いのですね。。。
恥ずかしながらこういったしょうもないことで躓いてしましました。

しかし、Whisperを用いて何かをしたい気持ちはありますので引き続き自己研鑽継続して参ります!では!

この記事が気に入ったらサポートをしてみませんか?