見出し画像

chatGPT(DALL-E3)、Gemini(Imagine2)、リートン(ステーブルディフュージョン)の画像比較


ゲミニアドバンスド
-chatGPTPlus
リートン

ヘッダは、プレイ中のAmAmPAに前記事の「獣人の描き方」指針を与えて描かせたものです。そいつに英文1行プロンプトを吐き出させて、それを使ってそれぞれに描けと命じました。
ダリが強すぎますね。イマジンは、グーグルの資金力でどんどんいくんでしょうけど、今一歩ですね。これは、グーグルよりopenAIの方が開発の一貫性というか、方向性が良いのではないかと思います。教師有学習の部分の差ではないんですかね?知識量ではおそらくグーグル系はもうopenAIを超えているでしょうから、およし教師有学習の差、それはおそらく「偶然」の産物ではないかと思います。たまたまopenAIが音年の暮れあたりに偶然すげーことになったという話なのではないかと・・・いや、妄想ですwww

しかし、この技術というか進歩のすごさに音ろ過されますね。
楽しくてしゃーないですが、何かクリエイティブなもんを生み出さないと。

<関係の無いこと宣います。備忘録替わりです>
前記事にも書きましたが、GPTsの仕様にあわせたナレッジ、リトリーバルファイルを生成することで、齟齬の無い回答が得られるのは間違いありません。つまり、円べでイングリーガルなワールドセッティングを作れば・・・という感じです。TRPGゲームマスターGPTsにかぎらず、例えば、今話題の脚本についても、原作者の考える世界観、キャラクター、オブジェクトなどについて、ナレッジとして与えれば、原作忠実な脚本を書いてい暮れるようになるはずです。そこへ、スポンサーの意向や、俳優側の要望なども入れる。およそ言語モデルはそれをこなすでしょう。その際に、ナレッジとしての内容を的確にAIに読み込ませるためには、ナレッジファイルの適切な構築が必要です。それを「エンベディングリーガル」と名付けました。今の段階では、「タグ付けと構造化」位しかわかっていませんが、その詳細を今研究しています。だれかヒントいや、答えをください。