見出し画像

(現時点での)AI生成画像のウィークポイントのFAが一言で出てた件

それがこちらのnoteでした。

AIを見る時、生成した側と鑑賞者の間には大きなギャップがあります。
生成側は「これすごいじゃん、プロみたい、写真みたい」と大喜びでアップしますが、基本的に鑑賞者側からのリアクションは薄いです。
生成者側は「なぜ?」と考えます。
わからないのでより多くアップしたり、方向を変えたりしますが、反応は芳しくない。じゃあ、とばかりに動画化します、曲もつけてみます。
それでも大して反応は変わらない、なぜ?
私が思う根本の原因、AI生成におけるもっとも欠如しているもの。
私が思う答えは「ナラティブがない」ということです。

AI生成で30万枚作ってわかったこと

「ナラティブがない」。
全く至言であります。
手描きもAI生成もガッツリ取り組んだからこそ出た言葉でしょう。

ではAI生成絵においては?
完全に絵の動機が欠如しています。生成者は「なんとなくのプロンプト」を入力してAIが返した出力結果から良さげなもの選抜して発表します。
なぜ動機が欠如しているのかといえば、現在のAI技術ではそこまでの完全なコントロールが出来ないからです。

メッセージのないビジュアルは不毛です。いかに美しかろうと高精細であろうと退屈であり、目は画像の上を滑るものです。
その視線を止めるものが絵のナラティブ。絵に含まれた意味意図が鑑賞者の興味を引きつけるのです。

AI生成で30万枚作ってわかったこと

↑こちらはもちろん私も激しく同意するところですが、AI生成師に限らないかなとも。
アナログでのお絵描きノウハウ(基礎画力)に欠けた、デジタルお絵描きツール依存技術しか使えない(ように見える)一部デジタル絵師にも共通してるかもしれないと私は思いますね。

というかこちらのnote、読んでみたら感動巨編でした。
特に『 「創作」とは』の章は必見です。
私が特に感動した箇所はぜひ原文で読んでいただきたいので引用しません。
そしてその部分は私も絵を描いてて共感するところです。

あと私も過去noteで似た趣旨のことに書いたことがあるような。

手描きのイラストは100%の自分です。全て自分がコントロールしています。下手なのは自分のせいで。上手いのはたまたま上手くいっただけ。そういう世界です。

AI生成で30万枚作ってわかったこと

まるっきり同じことを書いてるわけではないけど、隣接した場所を掠めて書いたことがあるなあ。

私にとって私の絵は好き嫌いではない。
ああ自分の絵だなあとだけ思う。
好きとか嫌いとかの感情論ではなくて、自分自身だなあと思う。
(略)
とどのつまりは私にとっての私の絵とは嗜好品ではなく、「私は私であり、世界をこう見ている」という宣言でしかないのであった。

自分の絵が好き嫌いで語れない話

逆に一箇所だけこの方と私の感覚が全く違うなと感じたのはここ。

ただ、どうやら私は「ボタンを押していい絵が出てくると快感する」変態らしく、気持ちよくて30万枚ポチポチやってしまいました。
快感こそ行動の源。

AI生成で30万枚作ってわかったこと

私の場合は以下である。

なので私は一本ずつの線を引くこと自体が楽しい「下書きなしの一発描き」でしかほぼ描かないというかなりの変態である。
一本線を引く→「うひっ、次はこんな線が見えてきたぞ!」→見えた線を引く→「うひっ」→線を引く→「うひっ」…
というのが私のお絵描き風景のスローモーション変換である。
(略)
言い換えると私は「見えた通りの線を一本ずつ引く過程のドライブ感に楽しみを見出す変態」なので、生成AI使ってその過程をすっ飛ばしてしまったら私のお絵描きの楽しみ自体がなくなってしまうのである。

画像生成AIから最も遠く離れたところにいる自分から見たあれこれ

この辺も隣接してるかな。

いずれにせよ、かのnoteの方の「ナラティブがない」が非常なる卓見で感心しましたね。

このナラティブの有無を私なりに解釈すると、素人写真とプロの写真の違いにも例えられるかなあと思う。

素人でもカメラ使えばとりあえず見た通りの写真は撮れる。
プロはそこに被写体に対して感じたそれこそ「ナラティブ」を表現するために、構図、画角、カメラ本体の選択、レンズ(本体やレンズ選びも技術、それらを揃える財力は情熱という名の沼)、シャッター速度、被写界深度、照明や天気、撮る時間帯…などの様々な技術や要素をコントロールする。
最大限の「ナラティブ」の表現のためにプロが駆使する技術や根気は素人には想像がつかないレベルだと思う。
例えば桜を撮るために高価で壊れ物の重い機材を抱えて日本全国を桜前線と共に北上し、人のいない早朝に起きて現場に向かう気力が湧く素人はそうそういないと思うのだ。

でも、素人写真にもナラティブがあるものももちろんある。
何気なく日常を撮ったスナップが、その日常が失われた時には何物にも変え難いものになるだろう。
なので、ここで言う素人写真とプロ写真の違いは一般論としての話である。

しかし写真に例えなくともお絵描きでもやはり同じことだろう。
AI生成画像は直接描画や着色に人の手による筆(ペン)でのタッチがない。
例えデジタル画であろうと手に持った筆(ペン)を介する描画のタッチは、その一筆一筆が描いた絵師の念(イメージ)から生まれる。

人の手で一筆ずつ描くのはAIに比べればそりゃ効率は悪い。
けれども、その代わりどこを強調しどこに力点をおくか、自分の意思で決められる。
その過程自体がナラティブになるのではないか。
何を表現したくて、何を選択し、何を省略するか。
何をどの程度強調するのか。

一筆一筆描くからどこを強め、弱め、引き立たせ、ぼかすのかをイメージ通りにできる(もちろん技量によって必ずしも目標の完成度で完遂できるわけではないが)

AIもざっくりならパーツ指定である程度イメージ通りに試行錯誤できるかもだけど,
でも生成された画像に重ねてほんの少しの強調とか陰影をもう一段深めるとか塗り重ねとかはできないように見える(Bing copilotを片手で足りるくらいしか試したことないけど)

というわけで現時点ではいきなり完成度高そう(に見える)な絵を吐き出すAI生成画ではある。
しかし任意の強調や減衰でイメージ通りにコントロールするのはやっぱり難しいと思う。
一気呵成に「大体ツボ周辺」は狙えるけど、ピンポイントの「ツボそのもの」は押せない、と前にも書いたことがある。

脳内イメージには必ず「ツボ」があって、ツボ「周辺」ヒットとツボヒットでは全く描いた充実感が違う。
「大体」イメージに合ってればいいというわけではなく、「ここはこうじゃないと『絶対』ダメだ」、という細かすぎるこだわりポイントが存在する。

それも、描く前からこだわってるわけではない。
描いてみてちゃんとツボにヒットした線が、描写が具象化された瞬間に初めてそれがツボだったことが知覚される。
つまり最初から狙っては描き表せないもの。
それが脳内ブラックボックスのツボヒットイメージである。

なのでツボヒットを目指してしまう。
(まあ目指して狙ってコントロールできるモノではないが)
ガチャのAI生成では「大体いい感じのツボ周辺」はたくさん、それこそ無数に出てくるだろう。
しかし、肝腎要のツボに完全にヒットするまでには一体どれだけ生成せねばならないのか、そこが不明である。
出てくる絵柄も(私にとっては)ツボ絵柄ではないし。
それならたとえにじり寄りしかできなくても、細かいこだわりポイントにジリジリと自力でにじり寄った方が数段早いと思うのだ。  

画像生成AIから最も遠く離れたところにいる自分から見たあれこれ

そんなわけで、私が無駄な長文でダラダラ書いちゃったnoteより、核心突いた「ナラティブがない」というFAの威力がすごいよね、って話。

この記事が参加している募集

今週の振り返り

この記事が気に入ったらサポートをしてみませんか?