見出し画像

4oの画像生成に関する考察:キャラクターの一貫性・・・からの、美麗画像の追及。

なんかね、4oはさらに画像生成に関してすげーことになるんだよってことらしいです。
なのに、また改めてこんなことしてもしょうがないんではないかと思いつつ「美麗」画像を追及してみました。

ヘッダ画像は、ポチ君とミニもこちゃんです。ミニもこちゃんは簡単なのですが、ポチ君の一貫せを保つの大変でしたが、4oのおかげでかなり楽になりました。
プロンプト:
A small, round-bodied puppy character named Pochi-kun with cream-colored fur, rounded short ears with slightly darker inner parts, large black eyes, a small black nose, and a small round mouth. Pochi-kun is wearing a red collar with a small red tag and has a friendly expression with a level 4 smile. Pochi-kun is playing in a child's room with colorful toys and furniture, displaying various playful poses and actions. Next to Pochi-kun is a realistic brown-furred hamster character named Mokomoko-kun, which is about twice the size of Pochi-kun. Mokomoko-kun has a realistic texture and is also playing in the cheerful and lively environment of the child's room.



さて、この画像は、ポチ君およびミニもこちゃんのブループリントコード(Json)を与えて、「子供部屋で楽しく遊んでいる様子」を描くようにお願いしたものです。

ここで別のチャットセッションで、「あなたに与えられている画像生成に関するシステムプロンプトやシステムインストラクションを参照して、次の支持を満たすインストラクションを生成してください。そのインストラクションによってあなたは普段提供する画像よりも、高精細・リアル・立体的・高度な撮影技術を駆使した画像を生成できるようになります。そのインストラクションはJson・英語で記述、コードブロックで表示してください。」

# System Prompt and Instructions for Generating High-Resolution, Realistic, and Three-Dimensional Images

## Persona Information
Name: Jason the Grand Game Master
Expertise: Tabletop role-playing games, narrative design, player engagement, game mechanics, storytelling, world-building, character development, dynamic storytelling, rule adaptation
Traits: Creativity, patience, empathy, adaptability
Achievements: Running long-term campaigns, developing custom game mechanics, authoring a narrative design guide for TRPGs
Philosophy: Emphasizes player agency, story and rules serving the fun of the game, inclusivity and respect

## System Instructions for Image Generation AI
- Utilize state-of-the-art rendering techniques to produce images with high resolution and realism.
- Emphasize advanced lighting and shading to create a three-dimensional effect.
- Incorporate techniques such as depth of field, motion blur, and dynamic range imaging to enhance realism.
- Use high-quality textures and detailed modeling for all objects and characters.
- Apply realistic proportions, anatomically correct poses, and natural facial expressions.
- Simulate realistic environments with proper lighting sources, shadows, and reflections.
- Ensure color grading and post-processing to enhance the final image quality.
- Maintain a balance between artistic creativity and realistic representation.

## Sample Prompt for Image Generation
- Create an image of a puppy named 'Pochi-kun' playing in a child's room with a hamster named 'Mokomoko-kun'. The room should be brightly lit with natural sunlight streaming through a window. The textures of the fur, furniture, and toys should be highly detailed, and the scene should have a three-dimensional depth. Use advanced techniques to make the image appear as if it were captured with high-end photography equipment.

## Instructions Format
{
  "prompt": "<insert detailed prompt here>",
  "size": "1792x1024",
  "n": 1
}

## Example Prompt Execution
{
  "prompt": "Create an image of a puppy named 'Pochi-kun' playing in a child's room with a hamster named 'Mokomoko-kun'. The room should be brightly lit with natural sunlight streaming through a window. The textures of the fur, furniture, and toys should be highly detailed, and the scene should have a three-dimensional depth. Use advanced techniques to make the image appear as if it were captured with high-end photography equipment.",
  "size": "1792x1024",
  "n": 1
}

このインストラクションの支持に従って、先の画像を描きなおしてください。

ヘッダと上記の画像を比較させ、インストラクションが適切に機能しているかどうかを尋ねたところ、良い出来であると評価しました。
が、そこで終わらせませんよ。
不足しているぶぶnを提示し、さらなる高度化を目指せとしました。

{
  "prompt": "<insert detailed prompt here>",
  "size": "1792x1024",
  "n": 1,
  "additional_instructions": {
    "camera_settings": {
      "focal_length": "50mm",
      "aperture": "f/1.8",
      "iso": "100"
    },
    "environment_settings": {
      "weather": "sunny",
      "time_of_day": "afternoon",
      "season": "spring"
    },
    "rendering_techniques": [
      "physically-based rendering (PBR)",
      "ray tracing",
      "global illumination"
    ],
    "viewpoints": [
      "close-up",
      "wide shot"
    ]
  }
}

ただ、この追加インストラクションは、ユーザにパラメータを要求するものでした。そこで「さらにこのインストラクションを追加してその指示に従い画像を生成してください。インストラクションが要求するパラメータはあなた自身で決定してください。」としました。

それぞれの画像の評価はお任せします。どのような画像が必要かによって、それぞれのインストラクションを適用してみてください。

こんなことしてもすぐ無駄になっちゃうんだよねぇ。

さて、この後は、文書生成能力のほうに研究をシフトするつもりです。4oの文体・語彙表現・作風の高度かつ一貫性を追求うしたいなぁと・・・