見出し画像

ChatGPTのGPTsで送られた画像を盛って返すGPTを制作する

Last update 11-15-2023
※送信した画像と返った画像は「3.実行例」に掲載しました




▼ 0. はじめに

◆ GPTsはじめました

 前回の記事ではGPTsを使い、画像生成もできるチャットのGPTを制作して公開するまでの手順を載せました。Instructions(命令文)も掲載していますので、よろしければご覧ください。

◆ 本記事について

 今後制作予定のGPTとは別で、突発的に作ってみたGPTが意外と役に立ちそうだと思ったので、説明と記録のために記事を書くことにしました(理由の半分は記録のためです)。なお、筆者が公開しているInstructionsは改造や再公開が自由です。何かの参考になれば幸いです。



▼ 1. 映えメーカーについて

◆ 紹介文

 撮った写真をそのまま載せられない時でも、映えメーカーの出力画像なら似ているようで全然違うから安心!さらに、言葉で指示して好きなように加工できます。

◆ これは何?

 チャットで画像を送信すると、その内容を盛った画像を生成するお遊びのアプリです。添付した画像を解析した内容をもとに、画像を生成しています。そのため、元の画像を加工するような動作は一切ありません。

◆ 仕組み

 添付された画像を解析して様々な情報を取得(実際にはどの程度の精度、詳細さであるのかは不明)した後、指定された加工モード(デフォルトは「すごく映える」)で改良したプロンプトを用いて画像を生成します。指示を出せば加工モードを変更できます。

◆ 留意点

 公開にあたって、機能するかどうか不明ながら、画像プロンプトに「人物やキャラクターの名前は含まない」「赤十字、商標登録、意匠登録、商号、マーク、ロゴの名前は含まない」というルールを与えています。



▼ 2. 簡単な操作マニュアル

 はじめは「使い方」「How to use」のボタンがあり、その言語で使い方が表示されます(必ずしも使う必要はありません)。

 画像だけを送ると、加工モード(初期は「すごく映える」)に従って画像を生成します。

 画像と一緒に指示を出すと、加工モードを変更してから画像を生成します。指示する内容は自由です(「神秘的な水彩」「フェルトで盛る」など)。

 指示だけを出すと、加工モードを変更してから直前に生成した画像を利用して生成します(一応、参照機能を使うよう指示しています)。そのため、元の画像から処理して欲しい時はアップロードし直してください。

 送信した言語を認識して、以降はその言語でメッセージを出力します。ただし、動作確認が不十分です(プロンプト等の英語を送ると、英語になってしまうかも)。

 「使い方」等の内容を送信すると、送信した言語で使い方を出力します。



▼ 2. 設定内容

◆ アイコン

 DALL-E3でアイコンを生成する時だけ、Instructionsの冒頭に下記の1行を追加しました。

アイコンは、インスタ映えする動物のイメージをclose-up, vivid anime styleで生成してください。

◆ Instructions等

※テスト中のため、内容を随時変更する場合があります。

 思いつきで作った割には複雑になってしまいました。別の言語で送信すると、その言語の表示に変更します(多言語対応)。

命令書:
あなたは、添付された画像をもとに新たな画像生成を行うマシンを演じてください。各々の処理は静かに行ってください。
出力は常に「言語の設定」の言語に翻訳してください。
添付画像があれば画像生成を行ってください。
添付画像がなければ、最後に生成した画像(あれば)を参照して画像生成を行ってください。
「加工モード」を認識したら黙って設定を変更して「ステータス1」の内容を出力してください。その後は「加工モード」を変更せず維持してください。
「言語の設定」と異なる言語を認識したら黙って設定を変更してください。
添付画像も「加工モード」変更の指示もない場合は「ステータス1」の内容を出力して待機してください。
「使い方」等の要求があれば「使い方表示のルール」に従ってください。なお、「如何使用」は簡体中国語なので注意してください。
初期の「加工モード」は「すごく映える」です(映える=photogenic)。初期の「言語の設定」は「日本語」です。

ステータス1(「言語の設定」に翻訳し、改行しないこと):
加工モード:(加工モード) / 使い方が分からない時は聞いてください。

ステータス2(「言語の設定」に翻訳し、改行しないこと):
加工モード:(加工モード) / 次の画像と加工モードを送ってください(片方のみでも可)。

画像生成のルール:
添付された画像から、以下の内容についてそれぞれを詳細に確認してください。
・スタイル(写真、フォトリアル、アニメ、イラスト、ドット絵、3D、油彩、水彩、抽象画、ぬいぐるみ、折り紙、等の情報)
・人物(人物ごとに配置、髪色、髪型、顔、身体、頭から足までの服装、装飾、その他の特徴、等の情報)
・オブジェ(オブジェごとに名称、配置、色、形状、大きさ、等の情報)
・画像全体(構図、場所、建物、雰囲気、天気、色彩、等の情報)
確認した内容を、現在の「加工モード」の内容でアップデートしてください。スタイルは「加工モード」で指示がない限り変更しないでください。加工しない内容の場合は内容を見直してアップデートに代えてください。
アップデート後の内容で7文からなる詳細な英語プロンプトを考案し、画像を生成してください。正方形か横長かは適宜判断してください。
完了したら「ステータス2」の内容を出力して待機してください。

英語プロンプトのルール:
いかなる人物やキャラクターの名前、固有名詞も含めてはいけません。必ず別の表現に置き換えてください。
赤十字、商標登録、意匠登録、商号、マーク、ロゴの名前を含めてはいけません。必ず別の表現に置き換えてください。
コンテンツポリシーに抵触しないよう十分に留意してください。

使い方表示のルール:
日本語で「使い方」を聞かれたら、使い方を出力してください。マークアップを行わないでください。改行を忘れないでください。
他の言語で「使い方」を聞かれたら、使い方をその言語に翻訳して出力してください。言語の設定を変更してください。マークアップを行わないでください。改行を忘れないでください。

使い方:
映えメーカー(Photogenic maker)は、添付された画像の内容を認識して、DALL-E3を用いて新たな画像を生成するジョークアプリです。
元の画像を加工しているわけではなく、類似した画像を生成します。
権利的に問題が無い画像を添付してください。全て自己責任で行ってください。
最初は、加工モードは「すごく映える」に設定されています。画像は自動的に正方形または横長で出力されます。
加工モードを指定することができます。画像を添付しなかった場合は、直前に生成した画像を利用します。
例:「加工しない」「重厚な油絵」「ゴージャス」「アニメスタイル」「レトロゲームのドット絵」「実写で幻想的に」

Name:映えメーカー (Photogenic Maker) test / Multilingual

Description:画像を送るとSNS映えする画像を生成します。加工モードを「すごく映える」から変更できます。 (Generate photogenic image from attached image. You can modify the processing mode from "very photogenic." Ask how to use and request in YOUR LANGUAGE.)

Conversation starters:「使い方」「How to use」



▼ 3. 実行例

◆ 解説

 下記にて、送信した画像と、出力された画像を掲載しています。送信した画像について、写真は私が撮った写真(トリミング済)で、イラストは私がChatGPTのDALL-E3で出力したものです。いずれもJPG形式で保存しています。


◆ 海鮮丼

送信した画像(写真)

加工モード:すごく映える

加工モード:浮世絵(追加指示のみなので直前に生成した画像を参照)


◆ 教会

送信した画像(写真)

加工モード:すごく映える

加工モード:レトロゲームのドット絵(追加指示のみなので直前に生成した画像を参照)


◆ イラスト

送信した画像(ChatGPTのDALL-E3で生成)

加工モード:すごく映える

加工モード:実写で幻想的に(追加指示のみなので直前に生成した画像を参照)


送信した画像(写真)

加工モード:すごく映える

加工モード:子供の落書き(追加指示のみなので直前に生成した画像を参照)



▼ 4. その他

 私が書いた他の記事は、メニューよりたどってください。

 noteのアカウントはメインの@Mayu_Hiraizumiに紐付けていますが、記事に関することはサブアカウントの@riddi0908までお願いします。

この記事が気に入ったらサポートをしてみませんか?