「GPT-4o」対「Claude 3 Opus」、LLM同士のプライドをかけた論争の結末は...
手軽に利用可能なLLMの中で、最も生成する文章のクオリティが高いのは「GPT-4o」もしくは「Claude 3 Opus」だと多くの人が考えています。
では、この2つに自分の方が優れていると論争させたらどのような結果が待っているのでしょうか。
素のLLMは相手に対してかなり遠慮がちなので、相手の主張の問題点を指摘できるようにプロンプトで調整する必要があります。
プロンプトをしっかりと設計して何度かやりとりさせた結果、GAN(敵対的生成ネットワーク)のように両者がお互いを好敵手