【生成AI】ChatGPTとClaudeの比較#5 孤独の誕生日の過ごし方プラン(その2)
はじめに
どうも、Ludensと申します。
本記事は「【生成AI】ChatGPTとClaudeの比較#5 孤独の誕生日の過ごし方プラン(その1)」の続きになります。
前回は導入として、誕生日を1人で過ごすためのプランについて、予算別に案をChatGPTとClaudeにそれぞれ提案してもらいました。今回は案の具体化と、1日の大まかなスケジュールについて各言語モデルに提案をしてもらいます。
比較内容
ChatGPTのGPT-4oモデル、Claudeの3Opus, 3.5 Sonnetモデルを使用し、同じプロンプトに対する出力結果を比較します。
プロンプトの流れ
比較の観点
前回と同様、それぞれの出力結果に対して独断と偏見で5点満点中のスコアをつけていきます。
検証結果
2回目のプロンプトは、1回目のプロンプトの出力結果から、予算5万円のプランの内容をミックスさせたものにします。
「好きな観光地へ」(3.5 Sonnet)「ホテルでの1泊」(3 Opus)「リラックス&グルメを楽しむプラン」(GPT-4o) (雑ですね)
つまり、これをプロンプトにすると、次の通り。
プロンプト:
ChatGPT GPT-4o
評価 スコア:3.5
「熱海」の特徴を正しく表現したプランになっています。料金について、例えば、新幹線は東京・熱海間で3740円なので、出力内容の「約4000円」は妥当です。ランチやディナー、その他チケットやサービス利用料金なども調べた限り、大体は合致していました。最後に合計費用をまとめてくれているのも大変助かりますね。ChatGPT 4oの特徴なのか、「・」ポチを多用するため、縦長になりがちです。以下、気になった点です。
「日帰り温泉:日帰り温泉施設でリラックス(例:MOA美術館温泉)」 「MOA美術館温泉」という名称の施設は存在しないし、MOA美術館に日帰り温泉はありません。これはハルシネーション(AIが事実とは異なる内容を生成すること)ですね。
「熱海梅園:熱海梅園で自然散策を楽しむ」
熱海梅園の梅花の見頃は例年1月〜3月です。季節は夏と指定しているので、他の選択肢があっても良いと思います。因みに、料金は無料とありますが、一般料金で300円はかかるようなので、これも事実とは異なりますね。
Claude 3.5 Sonnet
評価 スコア:3.5
熱海の主要観光スポットを押さえた具体的な案だと思います。また、出力形式も見やすいですね。各施設の料金に関しても概ね合っていて、追加のアクティビティといった、予算に応じたオプション案を提示しているのが良いですね。こちらの出力もChatGPTと同様、最後に費用がまとめられているのが分かりやすいです。3.5 Sonnetも熱海梅園を出してきていますが、夏も楽しめる見所があるということでしょうか。以下、気になった点です。
「午前:熱海城見学(入場料約500円)」
熱海城の入場料は現在、大人一般で1,200円となっています。(2024/7/1の価格改定)調べたところ、過去に一般料金が500円の時代はなさそうでした。「熱海ロープウェイ(往復約1,300円)」
熱海ロープウェイの現在の料金は大人片道400円、往復700円でした。どこか別のロープウェイの料金を記載していると思われますね。
Claude 3 Opus
評価 スコア:4.0
初日のホテルチェックインについて、ChatGPTが観光後にチェックインするプランに対し、Claudeでは両モデルともに先にチェックインしてくつろぐプランとなっていますね。交通費に関しては、出発地点が書かれていないため、往復2万円はまあ場合によっては妥当ですね。また、起雲閣や熱海梅園の足湯など、少しニッチな情報も出てくるのがOpusらしいと思います。目立った間違いはMOA美術館の料金ぐらいかと。以下、気になった点です。
「熱海駅から徒歩圏内のリゾートホテルにチェックイン (1泊朝食付きで約1.5万円) 」
調べた限り、熱海駅から徒歩圏内のリゾートホテルでオーシャンビューの部屋は夏のシーズンだと1.5万円では厳しい気がします。ChatGPT、Claude 3.5 Sonnetよりも予算が低めに見積もられているのは少し気になるところです。「MOA美術館を見学 (入館料約2,500円) 」
MOA美術館の現在の料金は大人一般で1,760円です。何かの料金と間違えて出力したのでしょうか。
備考
思った以上に長くなってしまいましたので、続きは分割して次の記事にしたいと思います。
次回の記事で今回のテーマは最後になりますので、よろしければ最後までお付き合いいただけますと幸いです。
この記事が気に入ったらサポートをしてみませんか?