大規模言語モデルといえば、やはりOpenAIのChatGPTが有名ですが、最近「Claude 3」が注目を集めています。あるベンチマーク測定では、GPT-4を上回る精度とのことで、大規模言語モデル戦国時代の到来を予感させます。
この記事では、「Claude 3」を提供する企業について簡単に触れるとともに、登録して使えるようになるまでの手順、有料登録のメリット、そして性能について説明します。具体的には、取り扱い説明書の作成や物語の創作において、「Claude 3」と「ChatGPT-4」、「Gemini Advanced」の性能を比較しています。(プログラミングの比較も行いたかったのですが、引用も含めると1万字を超えるため、別の記事で扱うことにしました。)
結論から言うと、確かに一部の領域ではGPT-4を上回っていると感じました。しかし、それはかなり限定的な部分です。総合的に見ると、現時点ではGPT-4の方が便利だと思います。例えば、画像生成やPythonのコード実行は、現在の「Claude 3」ではできません。ただし、1ヶ月後、3ヶ月後には状況が変わる可能性があります。今後の発展が楽しみですね!
Anthropic社とは何ものなのか
端的に言えば、GAFAの令和最新版の一端を担う企業となります。
GAFAと言えば、Google、Amazon、Facebook、Appleですが、それをしのぐ勢いで成長している企業を加え調整すると、Google、OpenAI、Microsoft、Anthropicとなるわけです。
個人的には、Googleの迷走を見るにこれに入れて良いのか考えてしまいますが、それでも時価総額は約1兆8718億6850万ドルであり、米国市場3位の企業ですし、一応独自のAIも持っているので、まだ入れて良いかと思います。
余談ですが、現時点ではMicrosoftが1位、次にApple、Alphabet(Google)と続きます。しかしここ数年、半導体のNVIDIAが上位に食い込んできているのは注目すべき点ですね。
さて、話を戻しまして、Anthropic社は2021年設立と若いベンチャー企業です。GoogleやAmazonからの支援を多く受けており、AIの透明性を重視して開発が行われています。
本当に信頼できるのかはともかくとして、現時点で最高峰のAIを独自に持っているのは非常に大きく、OpenAIのライバルとして今後も表舞台で戦うことになるでしょう。
超余談
さて、余談ですが、各企業の本社所在地を見ると、その企業の体質も見えてきます。Microsoftは比較的コツコツとした開発を行っているように見られます。これは、Microsoft本社が降雪地帯にあることからも想像できます。
ベンチャー企業が多く集まるシリコンバレーでは、仮に冒険して一文無しになっても、通年過ごしやすく、野宿してもまあまあ死にませんが、他方、雪が降る地域ではそんなことをすれば死にます。
つまり、短期的に見ればMicrosoftおよびその事実上傘下のOpenAIは負け続けると考えています。しかし、長いスパンで見れば、その限りではないかなと予想しています。
Claude 3とは何なのか
「Claude 3」は2024年3月4日に発表された、Anthropic社最新のAIモデル(サービス)となります。「Opus」「Sonnet」「Haiku」の3サイズが公表されていますが、執筆時点で使えるのは無料の「Sonnet」と有料の「Opus」のようです。
API周りも公開されていますが、一般人からすれば、ChatGPTのように使えるのか、ChatGPTと同じように使って役立つのか、という点に尽きると思います。
ちなみに、先出しですが、無料で使える範囲で以下のやりとりを行いました。近くにあった目薬の取り扱い説明書を見せています。変に装飾されたプロンプトを使わなくても、ここまでの回答を出してくれるのはかなり驚きました。こちらの意図を酌んでいるかのような印象を強く受けました。
後述しますが、GPT-4はさっぱり見当違いな回答をしました。この辺りはOCRの精度の問題だとも思いますが、現時点でClaude 3は採算度外視とも取れるリソースの割き方をしている印象も受けます。
Claude 3を使えるようにしよう!
2024/03/09時点の手順となります。
1.以下のサイトにアクセスします。
2.EmailまたはGoogleアカウントとの紐付けを要求されます。自分はGoogleアカウントにしました。
3.紐付けた後に電話番号の登録を求められます。スマホの場合、日本にしてから、「0x0xxxxxxxx」等実際の番号を入れましょう。
4.スマホの方に認証コードが送られてくるので、それを入力します。
尚、ここに来て18歳以上ですよね?のチェックを入れないといけないので、そうで無い人は退出です🫥
5.ここまで来れば注意事項等を読むだけです。
概ねChatGPT等と同じですね。暴力、虐待、欺瞞的なコンテンツ生成に使わないことや、フラグが立てられた場合確認しますよ、法律、金融、医療にかかる回答は責任持てないよ、ほか、ポリシー見てね、等が書かれています。
無料版だと結構渋い設定になっていまして、執筆時点(14時)で「5 messages remaining until 5 PM」となっています。つまり5回しかやりとりができないようです。(やりとりをするとカウントダウンされる仕組みなので、この点ChatGPTよりは良いですね!)
Subscribe to Pro
有料版に登録してしまいましょう。
有料版にすることで、やりとりできる上限が増えます。(時間あたり何応答できるのかは分かりませんでしたが、実質的に無制限っぽいですね。)
メッセージを送信する上部に「Subscribe to Pro」というリンクが表示されているので、ここをクリックします。
課金にはクレジットカードが必要です。また、自分は今safariを使っているためか、Apple Payも使えますね(結局使えるクレジットカードは必要です)。
月20ドルです。今のレートで約3,000円です。(しかし、個人的な話、AI周りのサブスクがエグいです。)
登録が完了すると上記のようになります。
性能検証
簡単に検証してみます。
医薬品の取り扱い説明書
当然ですが、この手の説明書は自分自身で読むことが何より大切です。分からないことは医師または薬剤師に相談しましょう。ただ、その前段階として、AIを活用できたら便利ですよね。
これは凄い!「使ってはいけない人」と聞いて、その項目はありません。ただ、「使用上の注意」や「相談すること」等記載されたところがあり、人間であればここを見るのかと類推できますが、AIもこれを行えて、かつこれほどまでに正確に回答できるのはかなり驚きました。
ChatGPTの回答は以下のようになっています。
ChatGPTの画像認識は日本語があまり得意ではないので仕方がないところではありますが、やはり「Claude 3」の性能の高さをうかがい知ることができます。
物語をつくってもらおう!
簡単な物語を創ってもらいます。入力したものは以下です。
Claude 3の回答が以下です。
いやぁ、これは凄い!好きです。
以下はChatGPT-4です。
いやぁこれも凄い!好きです。
以下、Gemini Advancedです。
🤔
以下、「たぬ」(人間)です。短いですが。
物語を添削してもらおう!
上記の執筆をベースに、添削をしてもらいます。
以下、Claude 3です。
これはかなり凄いです。当たり障りが無いと言えばそうですが、後に示すChatGPT-4は自分の物語も混ぜてアドバイスしてしまっているため、こちらの方がかなり実用的な気がします。
以下、ChatGPT-4です。
書かせた物語に続けて添削をさせたので、ChatGPT自身の物語の添削を混ぜているような気がします。
以下、Gemini Advancedです。
🤔
まとめ
現時点ではできることの範囲はかなり限定的ですが、生成速度や回答精度を見るに、「Claude 3」はかなりの有用性を示しています。
少なくとも、テキストのみの処理ではGPT-4を上回っているというのは、身をもって体験できました。ただ、その差は僅かで、現時点ではプロンプトの工夫次第でカバーできる範囲かもしれません。
しかし、「Claude 3」の性能は非常に印象的です。このようにAIサービスが競争することで、技術の成長が促進され、より良いサービスに繋がると思うので、OpenAIの一人勝ち状態が打破されることを期待したいですね!
おまけ(やりとり)
「Claude 3」はリンクが作れないので省略です。