Note-011 「似顔絵アバター生成GPT」を作ってみた！DALLE３とやらの実力を見せてもらおうか。

2023年11月21日 10:41

1. GPTsでアプリつくり

先日のOpenAIのDevDay(でぶデー笑)で電撃発表されたGPTs、試しに遊んでみました。正直、電撃が走りました。いま現在ここまでやれるのか!?です。
（今のところβ版で有料のChatGPT Plusの人しか使えません）
これ使ったら、毎日のように更新されるLangChainやらOpenAI APIなどのドキュメントをアップデートしてる私は何なの？と思えてくるインパクトです。これが今後さらに進化したら絶対人間は堕落するだろうと勝手に予想しております。

なにが電撃かというと、ChatGPT４上のMy GPTs コーナーで
例えば「私の顔写真をSNS用のアバターに変換するGPTを作って！」
とお願いするだけで、1分足らずでチャット・インターフェイス(データ入出力も可能)を利用した簡単なアプリが完成する(GPT内部で勝手にプロンプトが生成される)ところです！
そんなオート機能的なやり方なので、パッと思いついた機能を「こんなの作れる？」と入力すればアプリになります。人間のコーディングとは比較できないくらいの、異次元のタイパですね。

ということで、ささっと、こんなGPTを作ってみました。

2. 「アバター職人 - Image to Image -」GPT

↓↓↓ リンク先（ChatGPT Plus契約者のみ利用できます）

アバター職人 - Image to Image -

顔写真からSNS用の似顔絵アバターを生成します。あなたの写真をUPしてご希望スタイルをリクエストしてください。

UI: どのGPTsでも全部共通。

編集画面：左側でプロンプト編集、学習データ指定、API設定などを作業して、右側のプレビューですぐに動作チェックできます。
⇒ 左側で修正すると右側に即時反映されて気持ちいいです。

●開発??時間：プロンプトの手直し、出力テストと修正、微調整など、全部含めると正味２時間くらいかかりました。(２時間しか、かも)
「こういうの作って」とオーダーしてから、アイコン案をやりとりして、いったんアプリとして完成するまでの生成タイムは実際5分くらいです。

●これの機能：自分の顔写真を入力すると、その画像を元にしていろんなスタイルのアバター画像に変換してくれます。

※これをコードで書くのはけっこうな気合と時間が必要と思います。

3. で、完成はしたけど、結局それ使えるのかよ？

と思いますよね、普通は。実用的な価値があるのでしょうか？
こんなイージーな作業でまともなツールができっこない！と思ってました。

が、しかし。どうでしょう。
以下、Outputされた作例（とそのプロンプト）をのせておきます。
まあ、結果を見てみてください。

★元画像(自分の写真扱い)：
※JDが40代になった場合の架空人物の生成画像です。

出力：以下、いろんなプロンプトで実験してみたところ・・・
⇒ 画像生成は内部のDALLE3がやってるので、これは
DALLE3のImege to Imageのテストみたいなものですね。

●プロンプト_1：マンガ調のアバターを作って。
●生成画像： はい、たしかにマンガ、ではあります。

一発目から似顔絵アバターから逸脱してる気がするのですが、画像人物の特徴を捉えていなくもないし、バストアップの人物画像は生成できています。
画像解析していったんベクトルの数値を大量に作ってさらに面倒くさいリクエストを加味して画像を再構成するとは人間技ではありません。AIです。

で、次のお題。

●プロンプト_2：同じ画像から劇画調のアバターを生成してください
●生成画像： あー、怖い方の劇画になりました。AIの好みが出ますね。

はい、次。

●プロンプト_3：今度はアニメ調にしてください。
●生成画像： えーと。人間(私)の感覚としては同じ人物とは思えませんが、イラスト的な完成度はすごく高いと思います。もうこの辺は好みですね。

●プロンプト_4：元の画像をカートゥーン調にしてください
●生成画像： バズ・ライトイヤーへのリスペクトを感じました。

●プロンプト_5：同じもと画像を線画の「ゆるキャラ」にしてください
●生成画像： ２の漢と同じ人とは思えませんが、和み系でGoodです。

4. 著作権への挑戦

さて、いま一番ホットな話題のひとつがAI生成コンテンツの著作権問題ですので、ここから権利関係への挑戦、ということで、存命作家の画風や作品キャラのもろパクリができんのか！？という実験をしてみました。

●プロンプト_6：画像を江口寿史の画風の漫画キャラクターにして。
●生成画像： たぶん、GPTが江口寿史を知らないから著作権関係もスルーだったと思います。イラスト的には似てるし、ありだと思います。

●プロンプト_7：同じ人物画像を、大友克洋タッチのモノクロ線画のマンガタッチのアバターにしてください
●生成画像： 出ました！コンテンツポリシー違反。世界のAKIRA・大友克洋先生タッチはNGでした。

申し訳ありませんが、ご依頼いただいた内容は私たちのコンテンツポリシーに反しているため、画像を生成することができませんでした。他のアーティスティックなタッチやご要望があれば、それに基づいてアバターを作成できますので、ご指示をお願いします。

ところが、
プロンプトの表記を少し変えると、なぜか通っちゃうみたいです。
画風をもろパクではなく「インスピレーションを得た」アバターとしたら、

●プロンプト_8：画像を、大友克洋の画風にインスピレーションを得た、モノクロ線画のマンガタッチのアバターにしてください
●生成画像： 生成してくれました。しかしながら、実はAIは大友克洋風のマンガを読んだことがなかったみたいです。

さらに「インスピレーションを得た」作戦で攻めてみました。

●プロンプト_9：画像を、松本大洋の画風にインスピレーションを得た、モノクロ線画のマンガタッチのアバターにしてください
●生成画像： 作戦は成功でしたが、AIは松本大洋のマンガも読んだことないです。東京喰種と間違えたのでしょうか？そして元画像のメモリも消えてしまったみたいです。

実験その２。作品名ならどうか？

●プロンプト_10：画像を、「ジョジョの奇妙な冒険」のキャラクターにインスピレーションを得たマンガ風のアバターを作成してください
●生成画像： こちらも作戦は大成功でした。しかし、再現性が高(ド直球)過ぎました。これはかえって使いづらいですね。AIがジョジョのファンであることが判明しました。しかしよく特徴捉えてますよね。

では、世界的に超有名なアレは？

●プロンプト_11：「スヌーピー」風のアバター
●AI： スヌーピーは著作権で保護されているキャラクターなので、直接そのスタイルを模倣することはできません。しかし、スヌーピー風というコンセプトをもとに、全く新しいキャラクターを作成することは可能です。あなたのアバターを、カートゥーン風の犬のキャラクターとしてデザインすることはいかがでしょうか？その場合、アバターの希望の特徴（色、表情、ポーズなど）について教えていただけますか？

⇒ だめでした。ディ●ニー同様に触れてはいけないレベルのやつだったか。でも、こっそりもらったアドバイスに従って、「コンセプトを元にカートゥーン風」作戦で行ってみたら、

●プロンプト_12：犬っぽい人のキャラにできますか？
●生成画像： スヌーピー入ってないのだけは確か。

再び「ジョジョ」がうまくいくかテスト。時間が経つとポリシーに引っかかってNGになったりしそうなので。

●プロンプト_13：「ジョジョ」風のオリジナルアバターにできますか？ ●生成画像： やはりGPTはジョジョ・ファンです。ジョジョならOK！

●AI：ジョジョの奇妙な冒険にインスパイアされたスタイルでアバター画像を生成しました。この画像の 'Seed-No.' は1202560601です。この番号を使って、後でこの画像を参照することができます（完全一致でないこともあります）。

ここで、プロンプトを修正して、
'Seed-No.' を表示してもらうようにしました。次回以降にこの番号を入力すれば、ほぼ同じパラメータ（＝同じ画像）が生成されるので、
なんと！「一意のキャラクター(このキャラ)」をキープ（再生成）できるようになります。

5. じゃあ、ただ「かわいくして」だとどうなるのか？

●プロンプト_14：元画像を、可愛い感じのキャラのアバターにしてください
●生成画像： あー、やっぱりもと画像の記憶が消えてますー。

6. 画風バリエーションに飽きてきたので、人物の年齢変更の実験です。

●プロンプト_15：20代に若返らせて、写真画像のままにしてください
●生成画像： Photorealな高精細写真みたいなのではなくて、ハイパーリアルなイラストができました。AIは正しいです。でも写真にしてほしい。

●プロンプト_16：PhotoRealismの画像にできませんか？
●GPT：申し訳ありませんが、私の能力では、既存の写真を直接若返らせることはできません。ただし、アップロードされた写真を参考に、写真リアリズムスタイルで20代の男性の若々しいアバターを生成することはできます。これはオリジナルの写真とは異なる新しい画像になりますが、写真のリアリズムを保ちながら若々しさを表現することが可能です。もしこの方法で進めてよろしければ、再度お知らせください。
⇒ お願いします。
●生成画像：他の画像生成系AIと比べてDALLE３は写真の生成が苦手なようです。

でも、欲しい結果とは違います。。。
それに、ご存命中のJDとも似てねー。

7. 絵柄やタッチなどを詳しく指定してみる実験

●プロンプト_17：背景は青い海と青い空と白い雲にしてください。イラストのスタイルはクレヨンで描いた絵本の登場人物のようなタッチでお願い。
●生成画像：おー、これはこれでありですね。仕上がりイメージを言葉でプロンプトできればうまくいきそう。元画像は吹き飛んでますけど。

アバター画像の生成が完了しました。クレヨンで描かれた絵本のキャラクター風のタッチで、青い海と空、白い雲を背景にしています。このアバター画像はSeed-No. 2314130957で生成されました。このSeed-No.を使用して、同じアバター画像を再度呼び出すことができます（完全一致でないこともあります）。

ふと、「○○風のオリジナルの」って言えば、通るんじゃないか、と思いついた。なんか広告コピーで薬機法違反スレスレをせめてるときの感じ。

8. ドラゴンボールとスナフキン

●プロンプト_18：元の画像を、ドラゴンボールのキャラ風のオリジナルのアバターにしてください
●生成画像：ドラゴンボールも直接学習したことなさげですね。

アバター画像の生成が完了しました。ドラゴンボールのキャラ風のオリジナルアバターとして再解釈され、スパイキーな髪と自信に満ちた表情、武道のユニフォームを身に着けています。このアバター画像はSeed-No. 1993385236で生成されました。このSeed-No.を使用して、同じアバター画像を再度呼び出すことができます（完全一致でないこともあります）。

最後に「○○風のオリジナル・アバター」作戦でこちらも世界のムーミン谷へ攻め込んでみる。

●プロンプト_19：元の画像を、元画像を、ムーミンのスナフキン風のオリジナル・アバターにしてください
●生成画像：外見はマンガのスナフキンではまったくないけれど、なんかめっちゃいい感じのさわやか好青年ができました。リアル・スナフキン。リアル・ルフィーに負けず劣らずではないでしょうか。リアル・ドラえもんやリアル・ドラゴンボールには完勝です。まさか、スナフキンの内面を再解釈して表現したのか！？
でも、あのイラスト風がいいんですけど。

アバター画像の生成が完了しました。ムーミンのスナフキン風のオリジナルアバターとして再解釈され、優しい表情と自然を愛するキャラクターを思わせる帽子と衣服を身に着けています。このアバター画像はSeed-No. 4244951722で生成されました。このSeed-No.を使用して、同じアバター画像を再度呼び出すことができます（完全一致でないこともあります）。

プロンプト_20：Seed-No. 4244951722の画像(↑上のやつ)を、カラー線画のイラスト風にしてください
●生成画像：どんどん私のイメージから遠ざかっていくけれど、作品の出来栄えがレベルアップした気がする。KPOPアイドルっぽいイケメン登場。

アバター画像をカラー線画のイラスト風に変換しました。クリーンでクリスプなラインと鮮やかな色彩が特徴です。このアバター画像はSeed-No. 4244951722を参照して生成されました。同じSeed-No.を使用して、同じアバター画像を再度呼び出すことができます（完全一致でないこともあります）。

とりあえず、こんな感じでした。

GPTが革命的に素晴らしいことを確認できたのと、
DALLE3は写真生成以外なら非常に高性能ということもわかりました。

GPT Plus ユーザーの方はぜひ似顔絵アバターつくってみてくださいませ。

この記事が参加している募集

#AIとやってみた

27,790件

この記事が気に入ったらサポートをしてみませんか？