「呪技術」2022年7月31日の日記
・テキストから画像を生成するサービス『DALL·E2』の招待が届いた。登録したのが4月あたまだから4ヶ月くらい待ったことになる。
・DALL·E2は現状使える画像生成AIの中でもトップレベルに精度が高いと言われている。
・たとえば「ネコがパイナップルと一緒に踊っている油絵」と英文で入力するだけでこのような画像が出力される。
・かわいい。絵のタッチに機械くささがなく、むしろ人間の温かみすら感じる。
・イラストタッチだけでなく、実写風の画像を作り出すこともできる。
・「パイナップルにタイヤがついている」
・パッと見ただけではCGなのか実写なのかもう区別がつかないレベルだ。
・「アメリカ合衆国選挙で演説をするクトゥルフ神の報道写真」
・クトゥルフ神がなんか弱そうというか直視しても全然よゆうで正気を保てそうなくらい親しみやすい。なにげに合衆国旗を映すことで場所をわかりやすくするなど、構図もしっかり意図を汲んでくれている。
・文章を入力すると4パターンの画像が候補として生成される。
・「パイナップルの形の椅子」と入力してみよう。
・こんな感じで出力される。どれもクオリティが高いが、左上に関しては背中が痛そうだな。
・気に入ったものに関しては、似たテイストのバリエーションを作ることもできる。
・右上のバリエーションがこんな感じ。しかし全体的にバリエーションはクオリティが下がりやすいような気がする。
・あとから絵を描き足すこともできる。たとえばこのへんに柴犬がいてほしいなあと思ったら、その部分を消しゴムで消してから「a sitting shiba dog」とか入力してみる。
・すると柴犬が現れる。海外サイトのエラー画面で出てきそうな絵だな。
・これも毎回うまくいくわけではないが、多くの場合かなり自然に溶け込ませてくれる。特に犬やネコみたいにネット上に無数の資料があるモチーフはかなり高い成功率で馴染むようだ。
ここから先は
スキを押すとランダムな褒め言葉や絵が表示されます。