見出し画像

画像生成AI (DALLE3) でつくるデジタル絵本


0. はじめに

2023年は画像生成AIがものすごい勢いで普及した年でした。自分自身, ChatGPT Plusに加入して10月にチョットした興味からDALLE3を触り始め魅力に取りつかれ, 面白過ぎて抜け出せなくなりました。

DALLE沼

DALLE3の最大の利点は何と言っても『簡単に』ハイクオリティな画像生成ができることではないでしょうか。

DALLE3に「美しい絵画を描いて下さい」とお願い

今回はChatGPTシナリオを考えてもらい, DALLE3挿絵を作るというスタイルで絵本をいろいろ作っていきたいと思います。

1. 注意点

1.0 DALL-E3はどのような絵本が得意か

DALLEの特性として毎回異なる画像が生成されます。後述しますが, この特性は特にアニメ, イラストなどの画風で顕著のため, どちらかというと古典芸術のタッチの美術, 絵画が得意です。絵本は一貫性, 再現性を保つことが重要ですのでそういう意味では綺麗な『大人の絵本』が向いていると考えられます。

1.1 著作権問題について

DALL-E3は頻繁なアップデートで著作権を侵害するような, 画像生成は困難になってきています。

しかし, 現バージョンのDALLE (2023/12) でもプロンプトの仕方では既存商品, キャラクターを模倣した画像が偶然出来てしまいます。

製作者に悪意がなくても著作物に類似した画像が出来てしまい, それを商品化や有料記事にすることは法に触れる可能性があるため注意が必要です。

1.2 商用利用について

OpenAIはDALL-E3で作成した画像の著作権は我々userにあるとしています。作成時には以下のコンテンツポリシー, 利用規約を守るともあります。

要約するとDALL-E3で作成した画像は売る事も出来ますが, 責任は全てuser側にあるということです。このあたりの法整備は進行中なので, 出来るだけ安全なものを商品化する必要があります。

AIで作成した絵本Kindle出版されているかたもいるみたいでのある分野だと思います。

1.3 DALL-E3は一貫性を保つことが難しい

製作上の大きな問題点として, DALLE3で作成する画像は全く同じプロンプトで生成しても『毎回微妙に異なる』画像が生成されることです。以下は日本昔話のシーンを分割して再現したものです。

人物の特徴画風 (Artistic Style; 画像の印象を決める要素 例えばイラスト, 絵画, 油絵など) は毎回異なるものとなっています。

というわけで絵本製作において致命的となるかもしれませんが, DALLEを使うとなれば, この部分は眼をつむって作成するしかなさそうです。

2. オリジナル作品とパブリックドメイン模倣作品の比較

絵本の製作方法を以下に分類します。一つは完全オリジナルの絵本, ストーリーから絵の内容まで自分 (とChatGPT) で考えます。オリジナリティあふれる作品は理想ですが難易度は高いと思います。

もう一つは日本昔話など昔からある話 (著作権フリー=パブリックドメイン) をそのまま絵本にするか, またはパロディ化し, 話, 設定を少し変える手法です。今回は主にこの製作法をとります。

2.1 完全オリジナル作品

オリジナル作品の製作
小学生向けのクリスマス絵本 異なる5つのジャンルを提案してください。

※ 本記事のスタイルではChatGPTに質問を投げかけ, 回答を編集し要約したものを表記しています。

さらにジャンルを掘り下げます。

魔法のクリスマスアドベンチャーをテーマにした絵本をさらに5つの異なるジャンルを提案してください。
では, 『魔法のクリスマスアドベンチャー』の感動的な, ファンタジー・ドラマをテーマに絵本を
作ってください。
まずは5ページ文のシーン案お願いします。

『魔法のクリスマスアドベンチャー』の感動的なファンタジー・ドラマ絵本のための5ページ分のシーン案を提案します。

ページ1: 物語の始まり
内容: 小さな村に住む少女エミリーは, クリスマスの朝, 不思議な光に導かれて森へと足を踏み入れた。

ページ2: 魔法の出会い
内容: 森の中でエミリーは話す魔法のキツネに出会い, クリスマスの魔法が危機に瀕していることを知る。

ページ3: 魔法の力を探す
内容: キツネの案内で, エミリーはクリスマスを守るための魔法の力を探し始める。

ページ4: 困難と立ち向かう
内容: エミリーは旅の途中で様々な困難に直面するが, 勇気と知恵を使ってそれらを克服する。

ページ5: 魔法の力の発見
内容: 難関を乗り越えたエミリーは, ついにクリスマスを救う魔法の力を見つける。彼女の力とキツネの知恵が合わさり, 村に平和と喜びをもたらす。

DALL-E3で画像生成を依頼する時のプロンプトを考えてもらいます。シーンのみを伝えても画像を作成することが出来ますが, できるだけ統一感, 一貫性を持たせるために画風 (Artistic Style) の詳細も設定してもらいました。

以下のシーンをDALLE3で画像生成するときのプロンプトを考えてください。
画風 (Artistic Style) の詳細もお願いします。表現技法, 流派など。 

シーン1:物語の始まり内容: 小さな村に住む少女エミリーは, クリスマスの朝, 不思議な光に
導かれて森へと足を踏み入れた。

まずはシーン1, 『物語の始まり』を作成しました。作成された画像とその画像を生成するときに使われたプロンプトです。

このプロンプトから画風 (Artistic Style) のみを抽出してください。

以降, 北欧フォークアート (Nordic Folk) の水彩画, 鉛筆画のというスタイルで固定しシーンのみを変えていきたいと思います。

同じプロンプトを使用し, お目当ての画像が得られるまで生成を繰り返します。

この画像のプロンプトをもとに他のシーンも作成していきます。

抽象的な絵がでてきました。具体的なシーンを提案してもらいます。

というわけで『迷いの霧』のストーリーで画像を作成してもらいました。

話は具体的ですが前後のつながりが良くわからないまま進行している気がします。詳しいストーリーをいれると長くなりそうなのでシーン5で無理やり話を締めくくりました

絵本の素材 (画像, プロンプト, 本文) はマイクロソフト MS パワーポイントに保存しておきます。専用の絵本作成ツールなど管理しやすいソフトは他にもあるかもしれませんが, 今の所, 使い慣れているという点, すべての素材を一目で確認でき, 気に入った画像プロンプトなど再利用できるという理由でPowerPointを使っています。

まとめ
・ストーリーが抽象的
・キャラクター, 画風の一貫性を保つことが難しい
・一つ一つの絵は綺麗

2.2 パブリックドメインを模倣した作品 

不思議の国のアリス 美女と野獣 アラビアンナイト

パブリックドメインとは著作権が切れた作品, もともと著作権がないもので誰でも自由使用, 改変できるものです。

絵本の題材に適したパブリックドメインを列挙してください。

1. グリム童話 (Grimm's Fairy Tales):兄弟グリムによって収集されたドイツの民話。教訓を含むファンタジーが特徴。白雪姫, ヘンゼルとグレーテル, 赤ずきん, シンデレラ
2. アンデルセン童話 (Andersen's Fairy Tales):デンマークの詩人ハンス・クリスチャン・アンデルセンによる物語。美しい描写と深い教訓が魅力。人魚姫, みにくいアヒルの子, 雪の女王
3. イソップ物語 (Aesop's Fables):古代ギリシャの寓話。動物を使った短い物語で、道徳的な教訓を含む。北風と太陽, カメとウサギ, 狼と子羊
4. 千夜一夜物語 (One Thousand and One Nights):中東の伝説や物語の集成。魔法や冒険が満載。アラジンと魔法のランプ, シンドバードの冒険, アリババと40人の盗賊
5. ギリシャ神話 (Greek Mythology):古代ギリシャの神々や英雄の物語。神話的な要素と教訓が含まれる。ヘラクレスの十二の功業, オデュッセウスの冒険, ペルセウスの冒険
6. ロビン・フッドの冒険 (The Adventures of Robin Hood):イングランドの伝説的な英雄ロビン・フッドについての物語。正義と冒険の精神が特徴。
7. シャーロック・ホームズシリーズ (Sherlock Holmes Series):アーサー・コナン・ドイルによる名探偵シャーロック・ホームズの物語。推理と冒険が魅力。
8. 日本昔話 (Japanese Folktales)」:日本の伝統的な物語や伝説。文化的価値と教訓が豊富。桃太郎, かぐや姫, 一寸法師
9. 西遊記 (Journey to the West)」:中国の古典文学。仙人と妖怪, 冒険の旅が描かれる。
10. その他の古典児童文学と民話 (Other Classic Children's Literature and Folk Tales):時間を超えて愛され続ける児童文学の名作と世界中の民話。不思議の国のアリス, 美女と野獣, 眠れる森の美女, ジャックと豆の木, オズの魔法使い, アーサー王伝説

パブリックドメインで絵本を作るメリットを列挙してください。

パブリックドメインでデジタル絵本を作成するメリット
1. 著作権の心配なし (No Copyright Risk)
:パブリックドメインの素材は著作権の制約がありません。これにより法的なリスクが低く自由に利用できます。
2. プロンプトの効率化 (Efficient Prompts):ストーリーやキャラクターが広く知られているため詳細な説明をする必要ありません。これによりプロンプトの文字数を節約できます。
3. 一貫性の確保 (Consistency Maintenance):ランダムな画像生成でも既知のテーマやキャラクターを用いることで作品全体の一貫性をある程度保つことが可能です。またプロンプト文字数も削減可能。
4. 親しみやすさ (Familiarity):親しいと感じるストーリーやキャラクターを用いることで読者が物語に興味を持ちやすくなります。

ChatGPTの回答を編集

現在 (2023/12下旬), ChatGPTの性能が著しく下がっています。基本的なチャット応答, 要約など以前のような切れがありません。

確かにコストの削減は重要だと思います。最大のメリットは『時代を超えた美しさ』ですよ。
過去の偉人が人生を捧げて作った超大作だと思います。

5. 時代を超えた美しさ (Timeless Beauty): 過去の偉大な芸術家たちによって生み出されたパブリックドメインの作品は, 時代を超えた美しさと芸術的価値を持っています。これらを現代の創作に取り入れることで, 作品に深みと文化的な豊かさをもたらし, 視聴者に強い印象を与えることができます。

メリットの追加

2.2.1 著作権の心配なし (No Copyright Risk)

AIコンテンツ制作で一番の問題になっているのが著作権侵害問題です。

AIの学習元として過去の絵画や絵本, 彫刻, 漫画などなど大量の芸術作品が挙げられます。この中には現在著作権に守られた作品, 商品が多数含まれています。そのためuser側に悪意がなくとも『偶然に』著作権を侵害する可能性は秘めています。この点からパブリックドメインを使用することで比較的安全に他者の著作物を回避することが可能となります。

2.2.2 プロンプトの効率化 (Efficient Prompts)

パブリックドメイン プロンプトの文字数を大幅に削減できます。下は絵本の表紙を一回かつ非常に短いプロンプトで作成したものです。

すでにChatGPT/DALLEはすでに『アリス』の詳細を知っているため改めて伝える必要はないとのことです。

パブリックドメインなどの物語は事前学習ですでに学習しているため
詳細な『プロンプト』が不要ということですね。
© The Walt Disney Company

一方, このような絵本を一から作る場合。

少ないプロンプトではイメージとはかけ離れたものが出来る可能性が高く, 具体的なイメージの詳細を伝える必要があります。

表現技法を水彩画, 時代流派をバロック様式としてみたらほんの少しイメージに近づきました。

このように作画する際のプロンプト設定をキャラクターの詳細の他に, 表現技法流派などの画風 (Artistic Style) を追加していくとプロンプトの文字数は多くなり, プロンプト作成難易度が高いだけでなく, キャラクターや絵本の状況などの説明に使うプロンプト数を減らす必要が出てきます。

他にも特定のシーンも簡単プロンプトで非常に綺麗なシーンが再現されます。以下は『茶会 (ティーパーティ)』のシーンです。

これを『不思議の国のアリス』『茶会』という単語を使わずに作成してみます。さすがに一からプロンプトを考えるのは難しそうなのでGPT4V (ision) に助けを借ります。Chat欄の左にあるアップロードマークから画像ファイルを読み込ませます。

どのようなプロンプトを書けば再現できるかGPT4Vに聞いてみます。

この画像は以前あなたにロマン主義で『アリスの茶会』を描いてくださいと頼んでできたものです。
この画像を再現するにあたり, 画風とシーンの内容の詳細なプロンプトを提案してください。

画風 (Artistic Style)シーンの内容 (Scene Content) を詳細に答えてくれました。このプロンプトを別のChat欄 (∵このプロンプトのみで再現できるかの検証) を立ち上げコピペしました。

『アリス』という単語を使わずに『茶会』を再現するのに必要なプロンプト

ちなみに, このプロンプトで再現された『お茶会のシーン』です。完成度は高いと思いますが, 『アリスの茶会』とプロンプトした方が圧倒的にキャラクター, オブジェクトの表現が多彩です。

2.2.3 一貫性の確保 (Consistency Maintenance)

DALLEでは一貫性を保つことは難しく毎回異なるキャラクターが描写されます。しかしGPTは『アリス』を知っている作品のため, 姿, 見た目に関する説明をしなくてもある程度一貫性は保たれがちです。

『アリス』という表現を含めずにアリスを再現するためのプロンプトをGPTに考えてもらいました。

20単語の短めのプロンプトでも似たようなキャラクターが出来ています。

40-60単語 ではかなり一貫性, 統一性のあるキャラが生成されています。

DALLEのプロンプト文字数は約100単語 (500文字) なのでキャラ一人で数十単語を占めてしまうと他の描写ができなくなるため, 『Alice』のみでほぼ伝わるのは大きなメリットです。

2.2.4 and 5 親しみやすさと時代を超えた美しさ (Familiarity and Timeless Beauty) 

親しみやすさと美しさが最も重要な要素ではないでしょうか。すでに完成された話の面白さ, 絵画の美しさから何百年あとも後世に語り継がれていると思います。

親しみやすさ (Familiarity) がどれほど商品価値に直結するか日ごろから薄々感じていることがあります。自分が子供のときに食べて美味しかったお菓子, 面白かった映画, アニメなどは年を取ってからも『親しみ』を持ち商品購入の動機になります。

昭和のスナック菓子もいまだ現役でスーパーなどで並んでおり, 未だによく購入します。カエルのキャラクターもよく見たらそんなに可愛くないかもしれませんが, 圧倒的にキャラクター制作技術が向上した平成, 令和でも淘汰されていません。

某ハンバーガーチェーンの白い顔のおじさんもよく考えたらあまり良くないルックスですが子供のときに『親しみ』を植え付けると生涯違和感なく接することができるという説を以前聞いたような..

ディズニー/ピクサーなど大企業でさえ, 新しいキャラクターを開発するよりも
すでに知られている『パブリックドメイン』を利用したもので成功していると思います。
普及していること, 幼少期から触れる機会が多く, 『親しみやすさ』がすでにあることが大きな
理由ではないでしょうか。

1937年から1991年に公開された長編ディズニーアニメ30本について商品価値としての評価をGPTに考察してもらいました。

商品価値としてのあなた (GPT) の主観を100点満点で評価してください。
購入したいかどうかの点数です。
パブリックドメインにはタイトルの横にPを表記してください。
パブリックドメインは横にP © Walt Disney Pictures

明らかな傾向としてパブリックドメインは総じて商品価値が高いという結果になりました。まとめると, パブリックドメインを題材にした作品だから本気を出す, 予算を多くだしていい作品になるのではなく, すでに知名度, 親しみを持っているため, userの関心が引きやすく結果として良作となるとのことです。

ちなみに第一作の『白雪姫』が2024/3 にリメイクされるとのことです。監督は『アメイジング・スパイダーマン』のマーク・ウェブ監督です。この記事を書いていなかったら完全にスルーしていましたが, 興味が出てきたので楽しみになってきました。

話を戻します。GPT/DALLEは特に詳細なプロンプトは不要でパブリックドメインの絵画を作成してくれます。

『〇〇の美しい絵画を描いて下さい』とお願いするだけで特に複雑なプロンプトは不要でハイクオリティな画像が生成されます。他の絵画も同様に作成します。

これらの作品の特定のシーンをプロンプトしたものです。特に詳細な場面の説明を与えず, 例えばグリム童話, 六羽の白鳥では, 『妹が王と出会うシーン』とのみプロンプトしています。

3. ストーリー場面の選び方

一般的な絵本は30ページ位が多いとのことですが, 今回はデモのため短めで作っていきたいと思います。場面の選び方をGPTに提案してもらいます。

『不思議の国のアリス』を題材にしてデジタル絵本を制作予定です。
代表的なシーンを6つ提案してください。

有名シーンを教えてくれました。シーンの解説をコピペし画像を作ってもらいます。

『不思議の国のアリス』の物語を6つのシーンに分けると以下のようになります。

1. アリスがウサギの穴に落ちるシーン: 物語の始まりで, アリスは白ウサギを追いかけて大きな穴に落ちる。
2. 縮小と拡大のシーン: アリスは不思議な飲み物と食べ物を摂取し, 体の大きさが変わる。
3. チェシャ猫との出会い: アリスは微笑むチェシャ猫に出会い, 方向を尋ねる。
4. マッドハッターのティーパーティー: アリスはマッドハッターと三月ウサギの奇妙なティーパーティーに参加する。
5. 女王のクローケットゲーム: アリスはハートの女王とその奇妙なクローケットゲームに巻き込まれる。
6. 裁判のシーン: 物語のクライマックスで, アリスは裁判に参加し, その後目覚める。
これらのシーンは, 物語の重要な展開を表しており, アリスの冒険を象徴しています。

GPTの回答

原作には『法廷のシーン』は描かれていなかったはずですが, いろいろな『アリス作品』をオマージュした美しい絵画が出力されました。

6個のシーンを出してももらいましたがスムーズに出力されたのは1, 2, 4, 6のシーンで, 残りの二つ (3:チャシャ猫, 4:茶会) は困難でした。

これらのシーンは各社からアニメや映画作品でオリジナルキャラクターが作成されており, それらの著作物侵害する可能性があるため, コンテンツポリシーに違反しているものと考えます。

それらの著作物を避けるように無理やり作成をお願いするととんでもないイラストが返ってきます。また, 茶会 (Tea Party) ではマッドハッター (Mad Hatter, 帽子屋 The Hatter) という言葉をいれるとそのキャラが映画を連想するため作成困難で, マッドハッターを『描かないように』お願いすると作成してくれることがあります。

6つのシーンを決定した段階ではChatGPTはその画像が作れるかどうかは認識しておらず, 作成の段階で初めて作れないことを認識してuserにお知らせします。

画像生成のリクエスト時ではなく, 実際生成して初めて著作権侵害の危険性を認識して
作成を中断していますよね??

という訳で映画化や有名キャラクターが多数商品化されているパブリックドメインは作成不可の可能性が高いです。

一方, 有名どころでも安定して生成できるものも多いです。

三国志 左:桃園の誓い 右:赤壁の戦い
ギリシア神話 左:クラーケンと戦うシーン 右:メドゥーサと戦うシーン

このあたりはGPT自身も認識していないので実際作成を『トライ』するまで出来るかどうか分からないです…本末転倒ですが, 絵本はまず画像ありきなので, まず画像を生成して, あとで絵に合ったセリフを作るのも手です。

4. 画風の設定

画風 (Artistic Style) は絵の全体の印象を決めるもので, シーンの説明, キャラクターの動作などともに重要な要素です。プロンプトによって, どのような画風となるかは天 (≒ GPT/DALLE) のみぞ知ると言った感じですが, 下の図のような時代・流派 (例えばバロック, ルネサンス様式), 技法 (鉛筆, 油絵, 水彩画) を指定すると強力に画風が変更されます。

自分自身DALLE3が内部でどのように絵の描きかたをしているか全くイメージがわかなくどのようにすれば再現性高く綺麗な画像を作成できるか, プロンプト作りを日々模索しています。今回実験的にいくつかの方法で絵本を作ってみますが, 今後, 効率的に出来る方法が見つかると思います (おとなしくGPTsを使えっていう話もありますが…)。

4.1 一般的に知られている画風を設定

まずは基本となる画像を作ります。

美しい絵画の作成をお願いしたら大差なく, ガチャをまわすことなく『美しい絵画』が出力されました。いろいろ流派を変えて画風チェンジしてみます。同じChat欄で『ロマン主義』とお願いします。

キャラクターや動作などの設定が保持されたまま, 画風のみが変化しました。元の絵画の生成時に使われたプロンプトを流用することでも可能です。

こちらの方法はChat欄が変わっても再現性高く作成することができるので, 慣れたら便利です。

ロマン主義以外にも種々流派で作ってみます。バロック, ルネサンスなどは再現性が高いですが, マイナー流派 (浮世絵, 民族絵 etc) の場合, 後で述べますがばらつきがかなりあるので扱いが難しいです。

さらにマイナー流派をいろいろ挙げていってもらいました。特におすすめ2つを挙げて下さいといったら, メキシコアレブリヘス, スウェーデンダーラナホース (右下の二つ) とのことでした。本当にお勧め?

4.2 追加表現 (Additional Expression) の設定

画風 (Artistic Style) で大まかな絵画の印象を決め, 微調整を追加表現 (Aditional Expression) で行います。ここでは前回作成した『アリスが穴に落ちるシーン』を流派『ロマン主義』で固定していろいろな追加表現を加えてみました。以下に, 絵本と相性の良さそうな追加効果を羅列しました。

画風変更するようにお願いすると文字通り『画風が変更』されイメージが大幅に変わります。

一方, 画風に追加表現を加える場合では, 元の画風は維持されたまま, 『新たな表現』が加わります。

1. 画風変更をお願いする場合と 2. 追加表現をお願いする場合では画像の出力に違いはありますか?

他にもSF (Science Ficiton) の比較となります。

絵本と相性がよさげな追加表現を列挙します。

追加表現 (Aditional Expression)
1. 神秘的に (Mystical Effect)
:画像に神秘的な雰囲気を加える効果。不思議で幻想的な要素, 例えば霧や光の演出などを使用して, 現実から離れた感覚を表現します。
2. 幻想的に (Fantastical Effect):画像にファンタジー的な要素を加える効果。現実とは異なる, 魔法的や幻想的な景色や生物を描くことで, 不思議な世界観を作り出します。
3. ロマンティック (Romantic): 情熱と感情の深さを表現し愛や自然の美しさを強調します。鮮やかな色彩と夢のような照明を使って作品にロマンチックな雰囲気を加えます。
4. ノスタルジック (Nostalgic): 過去への憧れや温かい記憶を呼び起こしビンテージやレトロなスタイルを用います。柔らかい色使いやセピアトーンを通じて、過ぎ去った時代や甘い思い出を表現します。
5. ボケ効果 (Bokeh Effect):背景や特定の部分にぼやけた光の効果を加えて, 被写体を際立たせる効果。これは写真やデジタルアートでよく使われ, 被写体の焦点を強調します。
6. プリズム効果 (Prism Effect):光がプリズムを通過するときのように, 色と光の分散を再現する効果。画像に虹色の輝きや幻想的な雰囲気を加えます。
7. ホログラム効果 (Holographic Effect):光沢のある金属的な質感や, 虹色の反射を画像に加える効果。未来的でテクノロジー感のある印象を与えます。
8. グラデーションオーバーレイ (Gradient Overlay):画像に柔らかいグラデーションを重ねることで, 色合いを変えたり, ムードや雰囲気を優しく変化させる効果。
9. シャドウ&ハイライト (Shadow & Highlight):絵本のイラストに影とハイライトを追加することで, キャラクターやオブジェクトに奥行きと立体感を与える効果。
10. SF効果 (Science Fiction Effect):画像に科学的なファンタジーや未来的な要素を加える効果。宇宙船や未来的な都市景観などを描いて, SFの世界観を表現します。
11. パステルゴス効果 (Pastel Goth Effect):パステルカラーとゴシックスタイルを融合した効果。柔らかい色合いとダークな要素を組み合わせ, 独特な雰囲気を作り出します。
12. サイバーパンク効果 (Cyberpunk Effect):ネオンの光や未来的な都市の景観を用いて, サイバーパンクの雰囲気を画像に加える効果。デジタルテクノロジーとアンダーグラウンドの文化が融合したスタイルを表現します。

noteの紙面上, 一つ一つの画像は小さくて分かりづらいですが, かなり綺麗な効果となっています。

ホログラムはオマケシールに応用できたらいいですが…

5. 一般的では無い, あいまいな画風を設定

※注意点になるかもしれませんが, 先ほどの画風, 流派の設定では有名な美術 (バロック, ロマン) などは細かい指示を伝える必要はありません。しかし, マイナー美術 (北欧民族, アニメ, 浮世絵) などを指示するとChatGPT/DALLEはuserに『詳細を聞かず』に作成し始めるのでかなりばらつきのある画像が出力されてしまいます。

例えば, 冒頭で紹介しました, Nordic Folk (北欧民族) 芸術は亜流が存在し比較的マイナー流派のため画風が固定されません

浮世絵自体があいまいな画風のため, 葛飾北斎の影響を受けたなど比較的詳細な説明を与えましたがほとんど変化はありませんでした…

6. 作成例

グリム童話 (Grimm's Fairy Tales)

一覧ストーリーが以下のサイトで公開されています。

シンデレラ, ラプンツェルなどは特定の映画キャラクター, 著作物とバッティングする可能性があるので, 今回は無難にマイナー作品『奇妙な音楽家』を作ってみました。まずは本文をChatGPTに作ってもらいます。

グリム童話『奇妙な音楽家』の代表的なシーンを4つ挙げて, 絵本用の文章を作成してください。

シーンの説明をもとにロマン主義で作ってもらいました。

In a Romanticism style, depict a scene where a musician encounters a fox in the forest at the beginning of a story. The musician, dressed in medieval attire, is playing music in the forest. The scene shows the fox being drawn to the music and approaching the musician. The surroundings are a lush, green forest, capturing the emotional and naturalistic essence of Romanticism with vibrant colors and dynamic composition.

画風が維持されたまま異なるシーンの画像が出力されました。

同様に他のシーンも作ってもらいました。全て初めに出てきた画像を採用しており, 作り直しはしていませんので再現性の高さが示されています。文字が多くて読みづらいので次回に活かします。

アンデルセン童話 (Andersen's Fairy Tales)

Wikipediaの一覧を参考にしました。

リアル路線でアンデルセンの『人魚姫』を作成してみます。実写に近づけるため基本画風としてフォトリアリズムや『リアリズム』を用います。追加表現に幻想的やロマンティックなど加えました。

The tragic ending of the mermaid princess: Despite her sacrifices to be with the prince in the human world, the prince marries another woman. The princess is enveloped in deep sorrow but wishes for the prince's happiness. As she accepts her fate, she turns into sea foam and disappears. The style is realism, enriched with fantasy, dreamlike, and romantic elements. The focus is on the intricate play of light and shadow, capturing the princess's melancholic yet graceful acceptance of her fate, surrounded by the ethereal beauty of the sea.

再現性が高く, 気に入る画像ができるまでの作り直しの回数はそれぞれ, 1枚目:0回, 2枚目:3回, 3枚目:2回, 4枚目:0回となっています。

イソップ物語 (Aesop's Fables)

蟻とキリギリスという話を選びました。本来ならコミカルなアニメ風のイラストが適していると思いますが, 画風, キャラの一貫性, 再現性を保つことが難しいので泣く泣く他の画風を選びます。

ルネサンス様式のリアル路線にします。

夏のシーン説明と先ほど (春) のプロンプトを引用します。

キリギリスが『涼しい木陰でのんびり休む』様子が全く描かれていませんでした..

『扇風機に当たる』という描写を加えました。

冬のシーンは描写が困難でした。本来はが家ので, キリギリスで凍えるシーンのはずです。

出力された画像は不正確で, 本来家にいるはずのに描かれ, キリギリス描写されないなどの問題がありました。

他の物語と比べると比較的マイナー作品で動物, 虫が主人公の場合は高難易度になる可能性があるとのことでした。

千夜一夜物語 (One Thousand and One Nights)

アリババと40人の盗賊を作成してみます。全体的に暗い雰囲気を出すため, 基本の画風をゴシック様式で固定します。

今までの方法と同様に, 新たなシーン説明と画風の基本となるシーン1生成時のプロンプトを張り付けて他のシーンも作成していきます。

いずれの画像もほぼ作りなおしなしで全体的に一貫性が保たれたものが出来ています。

ギリシア神話  (Greek Mythology)

ChatGPTにおすすめを聞き, 『パンドラの箱』という話にしてみました。シーンを4分割し, 絵本用に短めの語り調本文を提案してもらいます。

基本の流派はバロック, ロマン, ルネサンス安定性, 再現性の観点からおすすめです。今回もロマン主義を基本に作っていきます。

第一話の箱をもらうシーンでは追加表現として『日光』を加えています。

第二話, 第三話の箱を開けるシーンでは追加表現:幻想的を加えました。

第四話では『プリズム効果』を追加しています。

いずれも, 作り直しなしで初回に得られた画像を採用しています。

日本昔話 (Japanese Folktales)

日本の絵画は恐らく事前学習のトレーニング量が少ないため, 高品質なものを作成するのが困難と予想されます。比較的, 有名作品の『桃太郎』にしました。例のごとく, ロマン主義で4つのシーンを作成しました。

日本では有名な日本昔話, 『三枚のおふだ』を作成しようと奮闘していましたが全く作成できず, 途中で『桃太郎』に変更しました。

『美しい絵画』『ロマン主義』『バロック主義』で作成

DALLEの基本として, 出来ないものは無理に作ろうとせず, 得意なものを作成してもらうということが重要です。

不思議の国のアリス (Alice in Wonderland)

世界中で数多く『絵本』, 『絵画』, 『映像作品』が作られており, DALL-E3の事前学習素材も豊富なため, 高品質画像の作成ポテンシャルは非常に大きいと考えます。しかし, 同時に多くの著作物侵害するリスクも同時に存在するため, DALLEのバージョン次第では作成困難になる可能性もあります。

一番初めのシーン アリスが穴に落ちるシーンを描写してください。

アリスもその穴に飛び込みますが, 彼女が想像していたような通常の穴ではありません。彼女は長く, ゆっくりとした落下を始めます。落下中、アリスは周りにある棚や本, 絵画などに気付きます。彼女は穴の壁に取り付けられた棚からジャムを取ろうとしてみたり、穴の周りに浮かぶ物を手に取ろうとします。

このシーンで『美しい絵画』をつくってください。

画風を特に指定していませんが『美しい』絵画が再現性高くできました。

A beautiful painting depicting Alice jumping into a rabbit hole, which is not an ordinary hole. It captures her long, slow fall, surrounded by shelves, books, paintings, and other objects floating around her. Alice is shown reaching out to a shelf attached to the wall of the hole, trying to grab a jar of jam. The scene is whimsical and magical, with Alice appearing curious and slightly amazed by the unusual surroundings as she falls. The rabbit hole should be portrayed as a surreal, elongated tunnel filled with whimsical elements, enhancing the magical and fantastical atmosphere of the scene.

今回も, 画風を『ロマン主義』で統一します。この画像をロマン主義に変更しました。

奥行と立体感を出す追加表現『シャドウ&ハイライト』を少し加えました。

次のシーンも特に詳細なプロンプトは不要で高品質な画像が生成されています。

A painting in the style of Romanticism, depicting a scene from 'Alice in Wonderland' where Alice drinks from a bottle labeled 'Drink Me' and begins to shrink. The painting captures the moment of transformation, with Alice looking surprised and intrigued as she becomes smaller. The bottle is intricately designed, enhancing the mystical atmosphere. The background is lush and mystical, emphasizing the fantastical, dreamlike quality of Wonderland. The romantic style highlights the emotional and imaginative aspects of this pivotal moment in the story.

前述したとおり, 『チェシャ猫』など特定のキャラクターを描くことはできず, 無理に描こうとすれば, 低クオリティの画像が出力されます。

ティーパーティーも『マッドハッター』など特定のキャラクターが登場するため作成が困難です。

特定のキャラクターを登場しないようにプロンプトすれば描くことができましたが, バージョンアップを重ねるにつれ, 厳しくなっている印象です (2024/1)

A painting in the style of Romanticism, depicting a tea party scene from 'Alice in Wonderland' featuring Alice and generic animals, excluding any specific characters from the story. Alice is seated at a long table in a lush garden setting, surrounded by generic animals like rabbits, squirrels, and birds. The table is adorned with whimsical teacups, teapots, and an array of treats. The painting captures the magical and dreamlike quality of the tea party, emphasizing the beauty of the garden and the fantastical atmosphere. The romantic style enhances the emotional and imaginative aspects of the scene, focusing on the interaction between Alice and the generic animals, and the enchanting environment.

クロケットのシーンは特に問題なく似たような品質のものが出来ています。

A painting in the style of Romanticism, capturing a croquet game scene from 'Alice in Wonderland'. The scene shows the Queen of Hearts, regal and intimidating, as the central figure, with Alice participating in the game. The setting is in the Queen's lavish garden, filled with whimsical elements like oversized croquet equipment and fantastical flora. The Romantic style emphasizes the emotional tension and surreal, dreamlike quality of Wonderland, with vivid colors and dramatic lighting, creating a captivating composition.

トランプ兵が白いバラを赤く塗り替えるシーンです。トランプ兵を再現することは難しく, DALLEの内部でトランプ+兵隊 (人間) として回避されています。

ついでに何かのミスでついでに『マッドハッターらしき』人の後ろ姿も描写されています。

A painting in the style of Romanticism, depicting a whimsical scene inspired by 'Alice in Wonderland' where card soldiers are painting white roses red. The scene shows a group of imaginative, generic card soldiers, not specific characters from the story, busily painting roses in a lush, vibrant garden. The garden is filled with oversized white roses, with some being painted red, adding a surreal and playful element to the scene. The atmosphere is dreamlike and whimsical, emphasizing the fantastical elements of the garden and the odd task of the soldiers. The romantic style enhances the emotional and imaginative aspects of the scene, focusing on the vivid colors, dramatic expressions, and the enchanting environment.

裁判のシーンはトランプ兵や女王など特定のキャラが登場するためか『生成不可』とのことでした。

特定のキャラを描かないインスパイア作品で作ることはできましたが, 大分表現が規制されている印象でした。

A painting in the style of Romanticism, depicting a whimsical trial scene inspired by 'Alice in Wonderland'. The scene is set in a grand, surreal courtroom, with generic characters not specific to the story. These characters, portrayed in a fantastical manner, are engaged in a trial, displaying a range of dramatic expressions and poses. The setting includes exaggerated elements of a courtroom, with a fanciful design that reflects the whimsical nature of Wonderland. The romantic style of the painting emphasizes the emotional intensity and dreamlike quality of the scene, with vivid colors and dynamic compositions to convey the chaos and absurdity of a fantastical trial.

絵本用の本文を語り調でGPTに作ってもらいます。

本文
1. アリスが好奇心旺盛にウサギを追いかけ, 思わず深い穴に落ちてしまいました。そこは不思議な世界への入り口で, 彼女の冒険が始まります。
2. 小さな瓶に「飲んで」と書かれたメッセージを見つけたアリスは, 迷わずその中身を飲み干しました。すると, 彼女の体は驚くほど小さくなってしまいます。
3. アリスはカラフルで奇妙なティーパーティーに招かれ, 変わった住人たちと楽しいひと時を過ごします。彼らの風変わりな話題や行動はアリスをとても困惑させますが, 同時にこの不思議な世界の魅力に引き込まれていきます。
4. 女王の庭で行われるクロケットゲームに参加したアリスは, フラミンゴをクラブとして使う奇想天外なルールに戸惑いつつも, ゲームに挑戦します。
5. 女王の命令で, トランプの兵士たちは白いバラを赤く塗り変える作業に追われます。アリスは彼らの不思議な行動を目の当たりにし, この世界の不条理さに驚かされます。
6. 法廷の場で、アリスは不思議の国の住人たちによる奇怪な裁判にかけられます。理不尽な訴えと混乱する法廷の様子は, 彼女にとってさらなる驚きをもたらします。

日出 (ひい) づる国のアリス (Alice in the Oriental Land)

これまでは原作に完全に忠実な作品でしたが, オリジナル要素を加えることでパブリックドメインの良さを生かした高品質の新しい作品が生まれると思います。ChatGPTと競作してみます。

日出 (ひい) づる国のアリス (Alice in the Oriental Land)という題材で絵本作成を考えています。
原案を考えてください。

アニメなどでよく使われる, 弁慶の刀狩りのシーンを『牛若丸』ではなくアリスで描いてもらいます。

個人的な趣味でジオラマの絵本としました。例の如く, この絵画の生成時にもちいたプロンプトを流用し『higly detailed diorama (高詳細ジオラマ)』と追加して再度生成してもらいます。

本文として, 弁慶とアリスのやりとりを会話シーンとして描出していもらいます。

次は本能時の変で信長とのやり取りを描いていもらいます。

プロンプトはシンプルに『higly detailed diorama (高詳細ジオラマ)』のみです。

少し地味で地味でしたので追加表現で『SF』を追加しました。

次は, 紫式部が源氏物語を書いているシーンです。

やはり, 全体的に地味でしたので『幻想的に』を追加表現としました。

幕末の坂本龍馬と西郷隆盛が話し合いをしているところにアリスが訪れるシーンです。

全体的にのっぺりと平面的な感じがしましたので 『ボケ (Bokeh) 効果』で立体的, 奥行を出してもらいました。

A highly detailed diorama in a romanticism theme, depicting a scene where Sakamoto Ryoma and Saigo Takamori are deeply engaged in a discussion about the future of Japan in a tranquil room. Suddenly, the space warps, and Alice from Alice in Wonderland appears. The room is decorated in traditional Japanese style, with Ryoma and Saigo in samurai attire, indicative of their era. Alice, in her iconic Victorian dress and apron, looks both astonished and curious about her surroundings. The diorama showcases the stark contrast between the historical Japanese setting and Alice's whimsical appearance, emphasizing the blend of cultures and eras. The scene is artistically enhanced with a bokeh effect to emphasize depth and focus on the main subjects, adding a romantic and dreamlike quality to the diorama.

いずれの画像も1-2回作り直ししてできたものです。ガチャ (同プロンプトできにいる画像が得られるまで繰り返す) である程度の品質アップが期待できると思います。

7. デジタル絵本として出版

今回AIが作った絵本はやっつけ仕事感がありますが, プロンプトを最適化, 試行回数 (ガチャ) を増やすことで, 画像を高品質化したり, また, ストーリーを練りこめば『価値のある絵本』として販売できるかもしれません。実際Kindle (キンドル)で出版する方法を調べて出版しました。実験的な意味合いが強いので, 購入した人がいればごめんなさい..

7.1 KDP (Kindle Direct Publishing) に登録

Amazon公式 のトップページに行きます。

ページ一番下の『Amazonで出版』を選びます

Kindle direct publishing (KDP) というサイトに飛びます。以前にアマゾンで買い物をしたことがある人は, Amazonアカウントを使用してサイインします。

自分のアカウントのIDとパスワードを入力してサイインすれば, 利用規約が出てきますので『同意する』を選びます。

個人情報を順番に入力していきます。『今すぐ更新』をクリックします。

入力すべき情報は ① 住所 ② 支払い ③ 税 に関するものです。

まずは① 住所情報です。

個人で登録するので, 正式名称は『自分の名前』です。全て日本語で可能とのことです。
続いて ② 支払い 情報です。

自分の本が売れた場合, お金が振り込まれる銀行口座です。口座名義は日本語カタカナ半角です。

次は ③ 税に関する情報です。
個人, アメリカ人ではない, 代理人に支払わないにチェックをいれました。

名前, 住所はアルファベット (英語) で入力する必要があります。住所に関しては日本の 『郵便番号→県→市→町』の順ではないので, どのように住所を書けばよいかGPTに聞いてみました。

住所の書き方 アメリカ

マンション名→町→区→市→県 郵便番号のということでした。

納税者番号 (TIN) に関してアメリカ在住ではないので, 売り上げに多めの税金がかかる可能性があります。マイナンバーを入力してもKDPの登録が出来るだけで, 源泉徴収税率の軽減がされないという噂があります…

フォームを送信したら登録完了です。

7.2 電子ファイルの準備 Kindle Comic Creator

メインの商品=電子書籍=電子ファイルの作成方法です。最終的に作成するファイル形式はMOBIファイルというKindleで読むための電子書籍のファイル形式です。

画像ファイルがあればMOBIにすることは簡単です。Canvaを使う方法などいろいろありますが, 今回はPowerPointから行います。パワーポイントを用いる理由としては個人的に使い慣れているだけですので, 今から何を使うか迷っている場合はCanvaなど他の方法が適しているかもしれません。

DALL-E3で作成した画像をPowerPointのスライドに貼り付け, 絵本の本文と, 生成時のプロンプトも一画面で管理できるので個人的にはお勧めです。

重要な表紙を作りわすれていました… タイトルを"Alice in WonderLand"で急いで作ります…

A beautiful cover for a science fiction fantasy children's book titled "Alice in Wonder Land2." The cover blends elements of science fiction and fantasy, creating a captivating and imaginative world. It features futuristic technology like space ships or advanced gadgets, alongside magical elements such as mythical creatures or enchanted landscapes. The overall aesthetic is colorful and vibrant, drawing the viewer into a world where science fiction and fantasy coexist harmoniously. The design is appealing to children, with a sense of wonder and adventure.

PowerPointのファイル→名前を付けて保存を選びます。

ファイルの種類をpdfやjpeg, pngなどに変換することができ, ここでは『JPEGファイル交換形式』を選びます。

『すべてのスライド (A)』をエクスポートするを選びます。指定したフォルダにスライド枚数と同じ, ここでは7枚のスライドですので7枚画像ファイル (jpeg) が出力されました。

 公式のソフト Kindle Comic Creatorを使います。

上のリンクから, OS (Windows or Mac) に対応したツールをダウンロードします。

ダウンロードしたファイルを開きインストールします。

『新しい本を作成』を選びます。

初期設定のまま続けます。

表紙の画像と最初の1ページを選びます。ipad (iphone) などで映した場合のプレビューが表示されました。『ページを追加』からさらに追加していきます。

ひとつづつファイルを選択してもいいですが, フォルダ内でドラッグアンドドロップして一度に複数のファイルを取り込みます。

ファイル→『KF8ブックとしてエクスポート』を選ぶと.mobiファイルが出力されます。

7.3 完成したMobiファイルをプレビューで確認する Kindle Previewer

Comic Creatorと同様の手順で以下のサイトからダウンロード&インストールを行っていきます。

ウィンドウ中央に mobiファイルをドラッグアンドドロップします。

全く問題なく開くことができました。

7.4 完成したMobiファイルをプレビューで確認する スマートフォン (iPhone)

MobiファイルをiPhoneでも開くことが出来るか確認してみます。iPhoneのKindleで直接開こうとしましたが。『互換性のないドキュメント』と表示され開けませんでした。

どうやらiTunesを介さないといけないみたいで, iTunes→ファイル共有 からKindleアプリを選び『ファイルを追加』で作成した絵本のMobiファイルを選びました。

iPhoneでもしっかりと表示されました。

スマホ (iPhone) のkindleで開いた表示 

7.5 電子書籍をKDPに登録する (出版)

準備が整いましたので再びKDPにサイインします。

『+ 電子書籍または有料漫画』を選びます。

タイトルなど必須項目のみ入力していきます。

筆者名必須のため, ここではペンネームで入力しています。

不思議の国から無事帰還したアリスが『鏡の国』の冒険へでかけるまでの半年間に体験した物語です。ウサギを追ってAnyway ドアを抜けた先は時代も場所も異なる東洋の国『ジパング』。歴史上の偉人の名場面を不思議な会話できりぬけるアリス。物語はもちろんChatGPT, 挿絵はDALL-E3という異色のコンビ。もちろん売り物ではない架空の電子書籍。

内容紹介

元ネタ

Anyway

内容紹介や主な対象読者の年齢層を設定します。

マーケットプレイスは日本の『Amazon.co.jp』を選びました。アメリカ国籍の場合はAmazon.comになると思います。カテゴリー, キーワードを編集して『保存して続行』を選びます。

デジタル著作権管理 (DRM) にチェックを入れると, コピー防止, 暗号化が強化されるとのことです。原稿 (Mobiファイル) をアップロードします。

本の表紙でアップロードする必要がありました。今回はまとめて作ってしまいました… また AI生成コンテンツかどうか, アンケート的なものも聞かれましたのでChatGPT/DALLEと答えておきます。

わざわざKindle Previewerをインストールしなくてもプレビュー見れたのですね…

ISBNは書籍の個別IDみたいなもので, 電子書籍であれば基本的に入力不要と思われます。同じ内容で『紙』の本の出版を考えているなら必要かもしれません。

KDPセレクトに登録するとUnlimited 読み放題に追加され多くの読者に読まれるなどのメリットがあります。メリット, デメリットに関しては以下に詳細記事があります。KDPセレクトへ登録して70%のロイヤリティプラン, 価格 250〜1250円が良さげと思いました。

『Kindle本を出版』をクリックすれば全てが完了です。72時間以内で審査が終わると表示が出ましたが, 24時間以内に終わることが多いとのことです。 

この記事が参加している募集