見出し画像

概要

この記事では、画像生成AIを用いて基本的な人物像を生成する初めての実験について報告します。人物一貫性保持テンプレートを使用して、一貫性のあるキャラクター像を作成するプロセスとその結果について詳しく解説します。

本文

人物像の生成は、画像生成AIにおいて一貫性を保つための重要なステップです。この実験では、人物一貫性保持テンプレートを用いて、基本的な人物像を生成しました。

  1. 基本情報

    • 名前: サトウユウキ

    • 年齢: 25歳

    • 性別: 男性

    • 職業: エンジニア

  2. 外見特性

    • 髪の長さとスタイル: 短い、整えられた髪

    • 髪の色: 黒

    • 眼の形: アーモンド形

    • 眼の色: 茶色

    • 顔の形: 長方形

    • 鼻の形: 直線的

    • 唇の形: 薄い

    • 身長: 175cm

    • 体型: 細身

    • 通常の服装: カジュアル

  3. 本音の特性

    • 一般的な性格: 内向的

    • 何に対して本音を出すか: 親しい友達

    • 本音での反応パターン: 穏やか

  4. 建前の特性

    • 社会的な性格: 礼儀正しい

    • 何に対して建前を出すか: 職場

    • 建前での反応パターン: 冷静

上記の人物を、人物一貫性保持プロンプトにします。

Yuuki Satou(human, male) has short, well-groomed, black hair. Their eyes are almond-shaped and brown, framed by straight eyebrows. Their face is characterized by a rectangular shape, a straight nose, and thin lips. They are 175cm tall and have a slender build. Their usual posture and unique mannerisms are described as reserved when in a professional setting and relaxed when among close friends.

このあたりは、なぁたんの記事で既出ですね。

このようにして生成された人物像は、以下のような画像生成プロンプトで使用されます。

画像生成プロンプト1

  • シーンの主要キャラクター: サトウユウキがオフィスでコーヒーを飲んでいる。

  • 背景要素: オフィスのデスクとコンピュータ。

  • 照明と色彩: オフィスの蛍光灯が明るく照らしている。

  • 時間帯: 午前。

  • テーマとコンセプト: 効率と集中。

  • これを英語一文にします。

  • Yuuki Satou is sipping coffee at his office desk, illuminated by bright fluorescent lights, with a computer in the background. The scene takes place in the morning and embodies the themes of efficiency and focus.

画像生成プロンプト2

  • シーンの主要キャラクター: サトウユウキが友達とカフェで話している。

  • 背景要素: カフェのインテリアと他の客。

  • 照明と色彩: カフェの暖かい照明。

  • 時間帯: 午後。

  • テーマとコンセプト: くつろぎと友情。

  • これも英語一文にします。

  • Yuuki Satou is chatting with a friend in a cafe, surrounded by cozy interiors and other patrons, under the cafe's warm lighting. The scene takes place in the afternoon and captures the themes of relaxation and friendship.

上記の人物プロンプトと画像生成プロンプトをAIを使ってフュージョンwwwします。

Yuuki Satou, a male human with short, well-groomed black hair and almond-shaped brown eyes, is sipping coffee at his office desk. He has a rectangular face, straight nose, and thin lips, standing at 175cm with a slender build. His demeanor is reserved in this professional setting. The scene is lit by bright fluorescent lights and features a computer in the background. Taking place in the morning, the atmosphere embodies efficiency and focus.

Yuuki Satou, a human male with short, well-groomed black hair, almond-shaped brown eyes, and a rectangular face, is chatting with a friend in a cafe. He stands at 175cm with a slender build and exhibits reserved mannerisms in professional settings but is relaxed among close friends. The scene is set in the afternoon, featuring cozy cafe interiors and other patrons, all under warm lighting, capturing themes of relaxation and friendship.

このようにして、人物の一貫性を保持しつつ、画像の質をあげていく方法を模索しています。ステーブルディフュージョンでは、LoRAなどでの人物の一貫性を保持する方法が模索されていますが、プロンプトでここまで近づけられるというのは、相乗効果をもたらすものと期待されます。私の勝手な機体ではありますが・・・

この実験を通じて、基本的な人物像を一貫性を持って生成することができました。今後はこの人物像をさまざまなシーンで使用し、一貫性が保たれるかどうかを今後さらに検証していきます。

ちなみに・・・


エマ・ロレンスを手にスプレイヤーや登山家、ボーグにしてみたときから全然進歩してないような気がする・¥・・

品質の高い画像が生成できるようになってはいます。と信じたい。Bing image creatorも進化しているはずで、そちらの影響が大きいだけだったらどうしよう・・・