【結論】GPT-4が使いやすいわ
以上。と締めくくりたいところですが、少しお話を。
Grokとは、イーロン・マスク氏率いるxAI社が昨年11月に発表したもので、X上で使用できるAIです。
それが、今年の5月8日頃、Xの課金グレード「プレミアム」以上で使用できるようになりました。将来的にはベーシックプランでも使えるようになるらしいです。
他社有料AI性能との比較はほぼ全敗だが・・・
『負けてると言っても数%の違いやから、日常生活レベルなら問題ない。しかもGPT-4やClaude3 Opusは月額$20(3000円程度)やけど、Grokはプレミアム料金980円やからこれはお得!』
実際使うまでは、こう思っていました。この数%の差がここまでストレスを生むとは思いもよらなかったのです。
正しく日本語を理解してくれない
どのくらい日本語を理解しているか計測するために、実際の大学生を対象とした調査「大学生数学基本調査報告書(2013)」のある問題を、Grok、ChatGPT(GPT-4)Claude3 Sonnet、リートン(GPT-4)、Gemini 1.0に解かせてみました。
論理的文章を理解する力、論理を組み立てて表現する力を測る目的で出題されたものなので、これが解けると一目置かれるAIと言えるのではないでしょうか。
日本の大学生もかなり間違えたみたいですし笑
答え言ってもいいですか?笑
・・・
・・
・
正解は1が確実に正しく、2と3が確実に正しいとは言えない、です。
解説は端折りますが、逆裏対偶の考え方があれば比較的楽にわかるのではないでしょうか。
それでは各AIの回答です。
Grok 不正解
Claude 3 sonnet 正解
ChatGPT(GPT-3.5) 不正解
リートン(GPT-4.0 Turbo) 正解
Gemini1.0 正解
正解したClaude3 Sonnet、リートン、Gemini1.0は無料というから驚きです。
公式発表の性能では、GrokはClaude3 Sonnetより賢い項目が多数あったので、せめて正解はしておいてほしかったです。
理解力不足によるストレス
Xのポストを読み取るとのことでしたので、「下記のポストに対するリプライの反応をまとめてください。」と指示を出しました。
すると、適当なリプライを抽出して、それぞれの内容を微妙な日本語で説明しだしました。全体の動向を把握したかったので、画像の質問をしたのですが、当たり障りのない反応。
具体的に聞くと、キャパオーバーしたのかオウムになりました笑
また、それまで日本語で会話していたにも関わらず英語で返したり、
ユーモアを超えてちょっと不気味な回答をしたり、
一個前の会話を覚えていないポンコツぶりなど、ChatGPTに課金していたときには味わったことのないストレスに、多々直面しました。
課金ならChatGPTかClaude3がよさげ
ChatGPTも課金して1ヶ月試しました。Grokで経験したような理解力不足のストレスはほとんどなく、商用利用可能のDALL-E3を使ったイラスト作成も非常に便利でした。
また、Claude3はまだ課金していませんが、無料のClaude 3 sonnetでもGPT-3.5より性能が良いです。専門的な使い方をしないのであれば、Sonnetでも十分な気がします。
現在の感覚では、ChatGPTに課金して、サブでClaude 3 sonnetを使う感じがベストかなと思います。
GeminiはGemini1.5 proが日本で利用可能になったら試してみようと思います。確か無料期間があったはず・・・。