見出し画像

ChatGPTなどのAI検索が比較できる「poe.com」を試してみる

最近、「ChatGPT」で話題になっている会話型のAI検索、マイクロソフトは「新しいBing」で対応しようとしています。色々と発表されているが、どんなものか試してみました。

ここで紹介する「poe.com」は電話番号か、メールアドレスだけで簡単に登録できて直ぐに使える便利サイトです。

私は取りあえず、gmailで新しいメールアドレスを作って登録してみました。登録すると6桁数字の認証コードが送られてくるのでWEB画面に入力するだけで使えます。

使える種類はSage、GPT-4、Claude+、Claude-instant、ChatGPT、Dragonfly、NeeavAIの7種類、但し、GPT-4とClaude+は1日で使える回数に制限があるので本当にお試し感覚です。

最初にテレ朝のモーニングショーで試していたように「羽鳥慎一とは?」で試してみました。

結果はほぼ似たり寄ったりで、共通の間違いポイントはNHK、TBS、ジャーナリストに関連したコメントが書かれていました。

ChatGPTなどで「TBSには勤めてないよ」的な会話をすると間違えを認めて内容を変更してきましたが、まだ正解には程遠い感じでした。

次に「元日テレの羽鳥慎一アナウンサーは?」的な内容で質問をしてみましたが半分ほどは、まだフェイクになってました。

知らない内容を質問するのですから、フェイクは困りますよね。だって、確認する手段が限られるし~~


そこで確実に内容が確認できる質問をして精度を比較してみました。質問内容としては

pythonで周波数1khz、10msのサイン波を作画したい

これなら、回答してきたコードを走らせて確認することができるから確実に評価できます。以下それぞれのAI検索で試した結果です。最後にGPT-4ベースのマイクロソフトの「新しいBing」でも試しています。

サンプリング周波数を指定しなかったのでCD規格の44.1KHzで書かれていますが、今どきは48KHzの方が自然かもしれませんね(笑)

検索時の操作画面全体


検索結果としてはコードがちゃんと書かれる場合と書かれない場合に分かれました。検索の種類によっては得手不得手があるようですね。


Sageの結果


GPT-4の結果


Claude+の結果


Claude-instantの結果


ChatGPTの結果


ここからはコードが書けないAI検索でしたが人間っぽい回答を書いてきましたね。

Dragonflyの結果


NeevaAIの結果

以下はマイクロソフトのサイトで試した結果ですが、エンジンがGPT-4ベースなのでほぼ同じような回答をしてきました。

新しいBingの結果

続けて「numpy、matplotlibのライブラリは何処にあるの」と質問するとインストールの仕方を教えてくれました。本当に賢い感じがしました。

最初に試したときに日本語で質問したら英語で回答してきた時がありましたが、日本で回答できないのと質問したら、以後、日本語になりました。

*********************************

殆んどのAI検索エンジンが2021年までのデータで構成されているので「今日の天気は?」と質問するとマイクロソフト以外はまともに回答できなかったです。

全体の内容的にはマイクロソフトが一歩進んでる感じです。しかし「お試し版」のためかもしれませんが、マイクロソフトは回答時の文字書き出し速度が遅すぎって感じがします。

最後に面白い使い方としては、誰もいない時の暇つぶしに「話し相手」になってくれることです。

普通に会話する感じで書くとそれなりに会話してくれます。こうやって使うと、なんだかネットで会話してる感じになりますね~~~(笑)


最後まで読んでいただいて有難うございます。 コメントは今後の参考に、フォローやサポートは今後の励みになります。