見出し画像

「Bing Image Creator」が「DALL-E 3版」に対応完了した後の画像出力の違いの感想

まず、上の前回書いた記事の
・はっきりとは日時はわからないもののおそらく、2023年9月30日頃から変わった「Bing Image Creator」が「DALL-E 3版」に対応完了した後に大幅に変わった変更点
の記事を先に読んだ方がわかりやすいです。

重要な変更箇所だけ書くと、
(1) 今回の画像生成AIの大幅バージョンアップによる「DALL-E3版」以降のBing Image Creator によって作成された画像生成AIで出力した全ての画像に、「C2PA 仕様に準拠した目に見えない電子透かしが含まれる」ようになりました。

<利点> 画像生成AIで出力した全ての画像に、「C2PA 仕様に準拠した目に見えない電子透かしが含まれる」ようになった事で、「誰がいつ画像生成AIで出力したのか?」が電子透かしに入るようになったので、この「C2PA 仕様に準拠した目に見えない電子透かしが含まれる」画像の1点のみについては、その画像をプロンプトを工夫して作った人物に著作権が発生すると認めていい感じの技術的な土台は完成はした。
・最終的には、『DALL·E 3で生成した画像は商用利用が可能』となるというメーカー側がしたい目標
はあるらしいが、
現状では、「アニメタイトル」をプロンプトに入れると、まだ著作権侵害の画像が普通に出る段階にあり、「画像生成AIの出力画像を商用利用するには、"自己責任"のリスクが高すぎる」段階にあり、まだ「過渡期にある」と判断した方が安全な状態です。

<リスク> 画像生成AIで出力した全ての画像に、「C2PA 仕様に準拠した目に見えない電子透かしが含まれる」ようになった事で、「誰がいつ画像生成AIで出力したのか?」が電子透かしに入るようになったので、上に書いたように、「誰が画像生成AIを使って著作権侵害をしたのか?」、「誰が画像生成AIを使ってフェイクニュース画像を作ったのか?」が非常に明確にわかるようになった。
このリスク部分が大きすぎて、現状、「ユーザーが気軽に画像生成AIを使える状態にはない」というのが現状の状況です。
このリスク部分が大きすぎるので、自分がやっていた「プロンプト公開」とかがリスクが怖すぎて現状できる状況では無くなってしまったので、今後は、できた絵を公開するようにする。(「プロンプト公開」をして自分のブログの活動方針は、「初心者クリエイター育成」目的もあるので、気軽に、そのプロンプトを入力してしまうと、画像生成AIは、「何の画像が出力されるか?わからない」ので、「C2PA 仕様に準拠した目に見えない電子透かしが含まれる」ようになった事で、初心者クリエイターがいきなり著作権侵害で訴えられる被害が出るリスクが非常に高すぎるようになってしまったので。要するに、今後は、「自己責任」度合いが非常に高くなってしまった)

(2) 画像生成AIメーカー側が、「オプトアウト(ユーザーからの拒絶申し立て)」の仕組みを導入した事で、最終的には、今後1~3年間後位かかると思われるが、その時期に入ってようやく、「画像生成AIで出力した画像の商用利用が可能になる時期がくる」
「オプトアウト(ユーザーからの拒絶申し立て)」をしたい人は、まず、画像生成AIメーカー側の、「オプトアウト(ユーザーからの拒絶申し立て)」の仕組みのクレーム受付のホームページに、「自分が著作権者なので、自分の作品を人工知能のビッグデータに入れないで下さい」のように言わないといけない。

要するに、「今現在の段階は、"人柱"期にあたり、技術の仕組みができた直後にあたるので、今、商用利用が可能な「電子透かし」の仕組みが導入されたと思って、先行して商用利用した人達は、"人柱"組で、いつでも、この「電子透かし」の仕組みにより、自分が著作権侵害者で訴えられる可能性が存在している状態」です。
ですから、自分の判断としては、
・「オプトアウト(ユーザーからの拒絶申し立て)」の一定の期間が必ず必要で、おそらく、今後1~3年間後位かかると思われるが、その時期に入ってようやく、「画像生成AIで出力した画像の商用利用が可能になる時期がくる」
というのが、安全に人工知能や画像生成AIを利用できる現状のリスク判断になると思われる。

どうして、自分が、「画像生成AIが次の段階に進むのに、「オプトアウト(ユーザーからの拒絶申し立て)」期などに、1~3年間位かかるのか?」と判断しているのか?というと、いろいろとあるのですが、人工知能関係のニュース全般を眺めていると、「どうも、2026年頃に人工知能や画像生成AI関係が次の大きなステップに進む段階の時期」が予定されているように思えるニュースが結構あるからです。
そのうちの1つが、「2026年 マイクロン広島工場で生成AI半導体メモリーを量産予定」なんかなのですが、次の段階の人工知能や画像生成AI関係の技術発展ステップをするには、「ハードウェアや、メモリ増産」なんかの方のハードウェア的なネック部分の解消問題の時期があって、それが解消され始める時期が、「2026年から開始」されるので、工場増産体制から一般普及まで1~2年間位はかかるので、この時期に、「画像生成AIが次の段階に進む」わけで、だから、その土台構築の今の時期は、「人柱」期(主に、法的な「オプトアウト(ユーザーからの拒絶申し立て)」期が終わっていないのに先行して、画像生成AIの商用利用を行った人達が、不意打ちをくらって、著作権侵害で訴えられるリスクが、まだ大量に残っている時期)であるわけです。

このように、
・はっきりとは日時はわからないもののおそらく、2023年9月30日頃から変わった「Bing Image Creator」が「DALL-E 3版」に対応完了した後に大幅に変わった変更点
は、かなり大きいバージョンアップとなっていて、これ以外にも、かなり大きい約款的な変更点があるので注意して利用した方がいいというのが現状の状況です。(細かい変更点については、前回の記事(この記事の最初のリンク記事)に書いてあります)

(2023年9月30日頃から変わった「Bing Image Creator」が「DALL-E 3版」に対応完了した後、実際、使ってみてどこが変わったのか?)

実際、自分が、「Bing Image Creator(DALL-E 3版)」に変わった後に、いろいろといじってみたら、結構、使い勝手が全然変わっていた。

(使い勝手が変わっていた箇所)

(1) 画質は大幅に綺麗になった一方で、「アダルトなどの制限」を、いろいろな部分で「制限」項目が細かく中身で技術的に入ってしまった事で、むしろ「当たり障り無い、つまらないありきたりな絵」ばかり出るようになった。
これは、画像生成AIだけでなく、人工知能全般に言える傾向なのですが、
・「制限」を大量に技術的に導入すればするほど、「当たり障り無い、つまらないありきたりな出力」しか出なくなり、「むしろ人工知能が馬鹿になっていく」現象が起きます。

この「権力者による制限過剰」状態は、すでに人類史の中で、何度か失敗を経験している。
絵画の歴史においては、「ヒトラーがやった」事で、「退廃芸術」とかヒトラーが呼んでいて、大幅な「絵画」や「芸術」表現に「権力者による制限過剰」状態を作っていた。
ヒトラーは、「絵画や芸術作品は、美しい政治家の理想を表現したプロパガンダのみを作るべきだ」のような思想で行動しだしたという、最悪の「人類史の中の文化破壊行動」の時期でした。
現状のまま、「権力者による制限過剰」状態を、画像生成AIや人工知能に課していって、開発者やメーカー側が、その方針で行動しだすと、最初は、良かれと思ってやっていたのに、「いつの間にか、開発者やメーカー側自身の方が、ヒトラーと同じ道を歩み、権力者側からみて望まないものに対して、一方的に、「権力者による制限過剰」状態を技術的に構築していってしまうと、やがて最終的に、ヒトラーがやった最悪の「人類史の中の文化破壊行動」と同じ事をやってしまう!という失敗をしでかす事になってしまう!
ヒトラーは、同様にして、「ヒトラーが望まない文書やテキストを全部燃やした!」わけですが、現在の人工知能や画像生成AIの規制や、「権力者による制限過剰」状態が、そのようになっていないか?をきちんと随時チェックを怠らないようにしておかないと、「気がついた時には、人工知能や画像生成AIの開発者やメーカー側が、知らず知らずの内に、ヒトラーと全く同じ道を歩み出し、ヒトラーがやった最悪の「人類史の中の文化破壊行動」と同じ事をやってしまう!という失敗をしでかす」事になってしまう!
このヒトラーにかなりそっくりな「文化破壊」を行った時期が人類史の中では他にもあって、中国の「文化大革命」の時期に、多くの文化破壊活動を、政治家主導で行っていた。

「権力者による制限過剰」状態は、このように、「文化の創造」ではなく、「文化の破壊」あるいは、「文化の誘導」という犯罪になっていないのか?を、人工知能や画像生成AIの開発者やメーカー側は常に注意を払っていないと極めて危険です。(「イスラム教徒がバーミヤン仏像などいろいろな物を破壊した」わけですが、現在、人工知能や画像生成AIの開発者やメーカー側が、「電子空間」内においても、同様の「権力者による制限過剰」状態を構築してしまっていないか?「ユーザーの文化創造を誘導」してしまっていないか?に注意を払って技術設計しなければいけない)

(いき過ぎた規制の末路)

現在の段階で、画像生成AIや人工知能の出力するデータに、「当たり障りない、つまらないありきたりな」という傾向が出始めています。
これは、「権力者による制限過剰」状態の「制限」項目が多いと起こってくる技術的な現象です。
かつて、ヒトラーがやった「規制」、「制限」などの大量の方針の結果、「権力者による制限過剰」状態が発生すると起きてきた当時の現象が、「ムーミン」、「バーバパパ」のように、「形状をはっきりと表現できない」という現象が発生します。
「ムーミン」の作者の「トーベ・ヤンソン」という人は、「実は、新聞用の政治風刺漫画を描いていた」人物で、初期の「ムーミン」のようなキャラクターは、そこで活躍していた。
ヒトラーのナチスドイツの影響を受けたヨーロッパ人達は、当時の恐怖心から、このように、「形状をはっきりと表現できない」という現象が発生します。
現在の段階で、画像生成AIや人工知能の出力するデータに、「当たり障りない、つまらないありきたりな」という傾向が出始めているので、その最終形は、「極度に線分を減らした」絵柄となっていき、最終的には、「ムーミン」、「バーバパパ」のように、「形状をはっきりと表現できない」という現象が発生します。
このヒトラー支配の恐怖心から、美術作品や、芸術作品、絵画などを、「形状をはっきりと表現できない」という現象が発生していた当時のヨーロッパに対して、「自由」を主張し憲法に導入したアメリカ、フランスなどで、ようやく、「ヌード」とかの表現ができる自由を謳歌できるように、20世紀後半にはなっていったわけです。
これによって、様々な文芸文化が大量に花開いて、文化発展の時期が訪れたわけです。
もともと「規制」というものは、「一律で全部に対してかけるべきものではない」のであって、「できあがった結果」に対して評価されるべきであって、何か良からぬ物と思っていた物が含まれていたとしても、「できあがった結果」としては、非常に、人々に感動を与えるものや、様々な「情動」を動かされるものが作り上げられるというもので、「作品制作前の過程の段階で、なんでもかんでも規制すべきものではない」
この「いき過ぎた規制の末路」は、「当たり障りない、つまらないありきたりな」という傾向の出始めから始まり、最終的には、「何も表現できなくなり」、「線分の削除」が行われていく傾向が出て、「ムーミン」、「バーバパパ」のように、権力者への恐怖心から、「形状をはっきりと表現できない」という現象が発生します。
ヒトラーの恐怖による支配の歴史を経験した欧米の人に現在も残る脳の障害として、「アファンタジア」という脳の障害が欧米人に出る人が多くて、ディズニー作品の「リトルマーメイド」の「アリエル」をデザインしたイラストレーターの「グレン・キーン」という人が、この「アファンタジア」という症状に苦しめられて、いろいろと苦労したようです。
「アファンタジア」という脳の障害の症状は、「物の形状を、精神的なイメージを生み出すことができない」症状で、主に、「視覚で見えている全体」の状態を同時に全部、認識できない症状です。
これは、絵を描く時だけでなくて、日常生活の道路を歩く時、買い物をする時など全てに渡って、そのように、「視覚情報を、脳が、精神的なイメージとして浮かべる事ができない」ので、日常生活はとても苦労するそうです。
といっても、「アファンタジア」という脳の障害の症状があったとしても、絵を描けないわけではなくて、「アリエル」をデザインしたイラストレーターの「グレン・キーン」という人は、「目ならば目だけに集中して描いて、それをつなぎ合わせていって、全体を作って描く事はできる」そうで、そうやって、「アリエル」というキャラクターは生み出されたようです。
このように、「恐怖による人の支配」は、精神的なPTSDを生み出すが、では?「権力者による制限過剰」状態を構築し出した、「人工知能や、画像生成AIを使い続けていった人」達が、そのようになっていってしまう危険性も考えないといけない。
このように、「権力者による強制的な規制」は、「文化的創造物を作ろうとしているクリエイター達にとっては、強制的に、脳にブレーキや、ブロックをかけ続けられている」状態にあるので、最終的に、「ムーミン」、「バーバパパ」のように、権力者への恐怖心から、「形状をはっきりと表現できない」という現象が発生し、やがて、脳への障害が発生していくという過程へ進む危険性は考え続けなければいけない。
ですから、何でもかんでも先に、「権力者による制限過剰」状態を作るべきではない。
『作品というものは、個々の部分ではなく、全体として完成されたものとなる』
わけなので、「部分に対しての過剰過ぎる規制」は、最終的には、上に書いてきたように、ヒトラーなどによる「権力者による文化破壊」などと同様にして、いろいろな弊害の方が大きくなっていく。

<自分が、「Bing Image Creator」が「DALL-E 3版」に対応完了した後、実際、使ってみてどこが変わったのか?>

自分は、「Bing Image Creator」の方をメインにずっと使ってきたので、細かい「Bing Image Creator(DALL-E 3版)」になった後の違いの実感がわかってきたのですが、地味でわかりづらいポイントをあげると、

(1) プロンプトの英単語「1つ」のみだと、「データが足りなすぎて出力できません」と画像生成AIに言われる。

(2) 形容詞を複数大量に書くとか、英語として文法がおかしいと、「ブロック」される回数が増えたような気がする。
「DALL-E 3版」は、「日本語の文章を、プロンプトに書いても、だいぶ理解はしてくれる」ようになった。

<「Bing Image Creator(DALL-E 3版)」で綺麗にはなったが、「当たり障りない、つまらないありきたりな絵」になりやすくなった今回の出力結果の例>
正直な感想としては、「Bing Image Creator(DALL-E 3版)」は、綺麗にはなったが、「当たり障りない、つまらないありきたりな絵」になってしまった。
・今まで、ずっと画像生成AIのネックだった「指の異常な形状」は、だいぶましになりました。
正直な感想としては、今まで、「Stable Diffusion」で「モデル」データを使って制限のある画像生成AI環境で活動していた人達も、「Bing Image Creator(DALL-E 3版)」では、「モデル」データ無しで、「テキスト文章で書いただけで、かなり綺麗に画像出力する事はできるように変わっています!」
「Stable Diffusion」など、他の画像生成AIは、「プロンプトの単語」による指示ですが、
・「DALL-E」系の画像生成AIは、「文章を理解してくれる」という事で、プロンプトの作り方が大幅に違い、使い勝手が違うので注意が必要です。
「DALL-E 3版」の場合には、普通に、日本語でプロンプトの文章を書いて大丈夫で、むしろ、「Stable Diffusion」などと違って、「そのまま書いた文章が絵になる」という不思議な体験ができる。(より人工知能っぽい)

ただ、元のアプリが英語なので、英語で書いた指示の方が正確なニュアンスを再現しやすい。
例えば、
『猫が草原を歩いている』という脳内の作りたい画像のイメージがあったら、そのまま、この文章を、機械翻訳ソフトで英語にして、
『a cat is walking on the grassland』
という、「文章」自体が、プロンプト指示として使えるのが、「DALL-E」系の画像生成AIは、「文章を理解してくれる」という特徴で、とても使いやすい。
旧版のおそらく2023年9月29日以前の「Bing Image Creator」は、「Stable Diffusion」より品質が大幅に劣っていた。
しかし、現在の「Bing Image Creator(DALL-E 3版)」では、ようやく、「Stable Diffusion」に品質が追いついてきました。
ですから、制限の多い、「Stable Diffusion」で「モデル」データを使って制限のある画像生成AI環境で活動していた人達も、「Bing Image Creator(DALL-E 3版)」では、「モデル」データ無しで、「テキスト文章で書いただけで、かなり綺麗に画像出力する事はできるように変わっています!」

次のような感じ位に、「綺麗」にはなった。(だが、個人的な感想としては、「なんか当たり障り無い、ありきたりでつまらないありふれた絵」で不満がある。「当たり障り無い絵」=「幼児向けでも大丈夫」みたいな状態で、こんな状態だと、大人の芸術家は活動できない状態)
みんながみんな幼児向けの絵本を作るわけではないので、現状のような強い制限や規制が増えていくのだとしたら画像生成AIは、あまり使えないツールとなって終了してしまいかねない。

<「Bing Image Creator(DALL-E 3版)」の出力画像例>

この記事が気に入ったらサポートをしてみませんか?