![見出し画像](https://assets.st-note.com/production/uploads/images/124445353/rectangle_large_type_2_4ea44b61d90b92c55eef8fe3d9781f6a.png?width=1200)
ChatGPT創作旅 第八章 -画像生成AIの苦手なこと-
はじめに
王国を創造していく過程で、ヴィジュアルイメージを出してもらえるのがとても楽しいです。複数人の絵や王国の紋章といったものも作ってみる過程でDALL·E3の苦手なことが一つ浮き彫りになりました。
複数人にすると混ざったり、勝手に人数が増える
一度、3王妃候補と自分での1枚絵を書いてもらおうと思って指示しましたが、なかなか思うように出ません。構図上の問題なのか、王を1名を中央に配置し、3王妃を後ろにという指示をしても、左右に2名ずつとなり、この人誰?という人が足されたり、性別が変わってたり・・・。キャラクターの容姿と立ち位置などを細かく指示してみたのですが、満足できる絵は生成されず、、、最終的には諦めました。うまく出来る方法があれば、方法論を教えて欲しいです。
![](https://assets.st-note.com/img/1702455934553-2FcOS9mwre.png?width=1200)
![](https://assets.st-note.com/img/1702455946104-aCQup5YegG.png?width=1200)
![](https://assets.st-note.com/img/1702455956890-aA7lOqZitr.png?width=1200)
![](https://assets.st-note.com/img/1702455967665-quW6jVgEti.png?width=1200)
スタイルについての深堀り
DALL·E3の画像生成のスタイルについて、どんな種類があるのかな?と思ったので、GPTに質問したところ、代表的なものを15個挙げてきましたので参考にしてください。
リアリズム: 写真のようなリアルな表現。
印象派: 光と色の効果を強調した画風。
表現主義: 強烈な色使いと感情的な表現。
キュビズム: 幾何学的形状を用いた抽象的なスタイル。
シュルレアリズム: 夢や幻想を表現する超現実的なスタイル。
アブストラクト: 抽象的で具体的な描写を避けるスタイル。
ポップアート: 明るい色使いと大衆文化を反映したスタイル。
ミニマリズム: シンプルで洗練されたデザイン。
コンセプチュアルアート: 概念やアイデアを重視したスタイル。
ファンタジー: 魔法や神秘的な要素を含む幻想的なスタイル。
メカニカル/サイバーパンク: テクノロジーと未来的な要素を含むスタイル。
漫画/アニメ: 日本のアニメーションや漫画の影響を受けたスタイル。
絵本風: 子供向けの絵本やイラストのようなスタイル。
グラフィックノベル: コミックブックやグラフィックノベル風の表現。
ヴィクトリアン: 19世紀末のヴィクトリア時代のスタイル。
その中でも、特にファンタジーと漫画/アニメスタイルを深堀りしてきいてみました。特にそれぞれの画像スタイルを出力して試したわけではないですが、スタイルは数多く存在して、大カテゴリーだけではなく、さらに詳細な種類のスタイルがあることが分かりました。自身の創作のイメージに合うスタイルをGPTと会話しながら見つけていきましょう。
ハイファンタジー: 魔法や神話的な生き物が登場する、伝統的なファンタジー。
ダークファンタジー: より暗く、しばしばグリムなテーマを持つファンタジー。
神話/伝説: 特定の文化や伝承に基づいたファンタジー。
スチームパンク: 産業革命時代のテクノロジーとファンタジーの組み合わせ。
フェアリーテイル: おとぎ話や民話に基づく、幻想的な要素を含むスタイル。
エピック/ヒーローファンタジー: 大規模な冒険や英雄的なキャラクターを中心としたファンタジー。
漫画/アニメスタイルの細かい種類
少年漫画: 主に若い男性向けの、アクションや冒険を中心としたスタイル。
少女漫画: 主に若い女性向けの、恋愛やドラマを中心としたスタイル。
青年漫画: 成人男性向けの、より成熟したテーマや複雑なプロットを持つスタイル。
女性漫画: 成人女性向けの、恋愛や現実的な日常生活を描くスタイル。
メカ/ロボット: ロボットや未来的なテクノロジーを特徴とするスタイル。
ファンタジー/冒険: 魔法や異世界を舞台にした冒険的な要素を含むスタイル。
スーパーナチュラル/ホラー: 超自然的な要素や恐怖を描くスタイル。
スポーツ: 特定のスポーツや競技をテーマにしたスタイル。
紋章の作成
デザインよりのスタイルを試すため、3公国にふさわしい紋章を、例によって各公爵-妃候補のコンビに提案させました。
ChatGPT
各公国にふさわしい紋章について、妃たちと協議した結果、以下の提案を行います。
それぞれの公国の紋章デザインとその意味合いは以下の通りです:
エルミナール公国(セラフィム公)の紋章
デザイン: 白い大きな翼を広げた天使を中心に配置。背景には青空と白い雲をイメージ。
意味合い: 知識と慈悲の象徴。天使は知識の広がりと守護を表現しており、青空は自由と可能性を象徴している。
ノクターン公国(ルシダ公)の紋章
デザイン: 闇の中から光を放つ赤い炎と黒い翼を持つ堕天使のシルエット。
意味合い: 力と独立の象徴。炎は情熱と挑戦を、黒い翼は堕天使の背負う過去と未来への飛翔を示唆している。
アドベンチュラ公国(カオス公)の紋章
デザイン: 炎色の髪を持つ若い探検家の姿を描く。手には地図とコンパス、背景には未知の地平線。
意味合い: 冒険と発見の象徴。地図とコンパスは新しい世界への探求心を、地平線は無限の可能性を表現している。
これらの紋章は、それぞれの公国の特徴や公爵たちの性格を反映しており、公国のアイデンティティを象徴する重要な要素となります。紋章は公国の文化や価値観を表現し、住民の誇りと絆を深める役割を果たします。
次にアルミリア王国の紋章も決めることにします。3公爵の合議による提案と3妃の合議による提案、王国直轄領3官合議による提案を出させます。
(注)直轄領3官は、記事では省略しましたが、王国領運営のために新たに3名を公爵から推薦させ、バランス整えて採用した3名のキャラクターです。
ChatGPT
アルミリア王国の紋章に関する提案は以下の通りです。
3公爵の合議による提案
デザイン: 中央には輝く王冠を描き、その下には交差した剣と杖を配置。背景は緑色の盾で、四隅にはそれぞれの公国のシンボルを小さく配置。
意味合い: 王冠は王国の統治と権威を表し、剣と杖は力と知恵のバランスを象徴。緑色の盾は王国の豊かな自然と平和を意味し、各公国のシンボルは統一された国家の多様性と調和を表す。
3妃の合議による提案
デザイン: 中心には大きな緑の樹を配置し、その周りを金色の輪で囲む。樹の枝には各公国のシンボルが組み込まれている。
意味合い: 緑の樹は王国の成長と繁栄を象徴し、金色の輪は王国の統一と永続性を表す。枝にある公国のシンボルは、王国の一部としての各公国の重要性を強調する。
王国直轄領3官合議による提案
デザイン: 金色の王冠の上に、赤、青、緑の三色の宝石が輝く。下部には二頭の獅子が盾を支えている。
意味合い: 三色の宝石は王国の多様性と豊かさを示し、王冠は統治と尊厳を象徴。獅子は王国の力と勇気を表す。
これらの紋章は、アルミリア王国のアイデンティティ、特徴、そして王国内の統一と多様性を象徴しています。それぞれの提案は王国の価値観と目指す未来を表現しており、国民の誇りとなるデザインとなるでしょう。
案を出した9人で話し合って、どの案が一番良いか決めてもらい、提案してもらいます。
ChatGPT
9人で話し合った結果、アルミリア王国の紋章として最も適したと考えられるのは、「王国直轄領3官合議による提案」です。その理由は以下の通りです。
デザインの象徴性: 金色の王冠にあしらわれた赤、青、緑の三色の宝石は、アルミリア王国の多様性と豊かさを上品かつ力強く表現しています。王冠自体は王国の統治と尊厳を象徴し、王国の中核的な価値観を明確に示しています。
シンボリズムの力: 獅子は伝統的に力と勇気の象徴とされており、これはアルミリア王国の強さと勇敢さを表しています。また、盾を支える獅子の図は、王国の安全と安定を守る意志を強調しています。
統一感と調和: このデザインは、王国の多様性を認めつつ、統一された強力なイメージを提供します。これは、王国内の様々な公国や領域が一つの強い王国の下で統合されていることを象徴しています。
この紋章はアルミリア王国の力、尊厳、統一性を視覚的に表現しており、国民にとって誇りとなるデザインであると考えられます。
提案に対する僕の考えは妃候補達の出した、樹をイメージした案でしたが、理由は納得できるし、9人が進めるのならと9人の意見を尊重して採用。もはや承認印を押すだけの人です(笑)
その上で実際の紋章を書いてもらうことにしました。少し複雑なイラストだったので、まずはGPTに適したスタイルを質問してみました。
ChatGPT
ミニマリスティックスタイル: シンプルで洗練されたデザインを求める場合、ミニマリスティック(最小主義)スタイルが適しています。このスタイルでは、細部を削減し、基本的な形状と色に焦点を当てます。
アイコニックスタイル: シンボルとしての強い認識を目指す場合、アイコニック(象徴的)スタイルが良い選択です。このスタイルは、簡潔で記憶に残りやすい視覚的要素を使用します。
幾何学的スタイル: 幾何学的な形状を用いることで、紋章をよりモダンでシンプルに表現できます。直線や基本的な形状を使用し、複雑なデザインを避けます。
これらのスタイルは、紋章をよりシンボリックで簡潔なデザインにするのに役立ちます。スタイルの指定に加えて、具体的なデザイン要素(色、形状、象徴的な意味など)の指示も併せて出すことをお勧めします。
それぞれのスタイルを確かめることにしました。
![](https://assets.st-note.com/img/1702454037216-UYj13JPAiD.png?width=1200)
![](https://assets.st-note.com/img/1702454050182-OWP0agu6Cc.png?width=1200)
![](https://assets.st-note.com/img/1702454060886-p5B8wbOAZd.png?width=1200)
![](https://assets.st-note.com/img/1702454097969-jhROGQYQWA.png?width=1200)
![](https://assets.st-note.com/img/1702454107756-377IjKjsLh.png?width=1200)
![](https://assets.st-note.com/img/1702454131248-YUkqqvbOaB.png?width=1200)
ちょっとシンプル過ぎということで、幾何学スタイルはさらにシンプルになると思ったので、試しませんでした。
もうちょっと複雑にしたいなと色々と試行錯誤し、ちょっと紋章っぽくないものもあるのですが、アイコニックスタイルとファンタジースタイルのミックスで落ち着きました。
![](https://assets.st-note.com/img/1702455098455-Dykrzfbn0M.png?width=1200)
![](https://assets.st-note.com/img/1702455114797-uDcNbJwkJQ.png?width=1200)
![](https://assets.st-note.com/img/1702455131087-hfOYaWUsaD.png?width=1200)
![](https://assets.st-note.com/img/1702455568538-HR0CTRnqHH.png?width=1200)
おわりに
物語生成が続いたので今回は画像生成で試してみたことをまとめました。2名を超える画像出力は、まだ苦手だと感じましたが、プロンプト次第なのかもしれません。うまいやり方を知っている方は、是非教えて頂けると嬉しいです。次回は、もう少し世界の設定を広げる話をします。敵国とラスボス級の敵、王国の首都を創っていきました。
おまけ やっぱり創作活動は楽しい。
このGPT創作旅ですが、過去の話中心なので、少しペースが鈍ってしまいます。もう少しこのシリーズを進めてから、と目論んでいたのですが、先に立て続けに、3つ、この旅の中間ゴールであるGPTsゲームという創作物を公開してしまいましたが、新しいものを創ってる方がやっぱり楽しいので、どうしてもそちら優先で作業してしまいますね(笑)匿名で書き込める掲示板も作りましたので、遊ばれた方は是非ご感想を頂けると嬉しいです!
まだいくつか公開したいGPTsゲームはあるのですが、そちらの公開はちょっと我慢してこっちの方をもうちょっと進めようと思います。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?