見出し画像

AIに左利きの人物画像を、偶然に頼らず生成させる方法を考える

 AIの進化はすさまじく、画像や動画の作成も簡単にできるようになりました。しかし、僕が使って感じたことは、画像生成に関して言うと、左利きの人物描写がかなり苦手だということ。最新のGPT‐4oで試してみます。

You
左投手が剛速球を投げている画像を生成してほしい。

こちらは速球を投げる左投手のイメージです。他に変更または追加したい詳細がある場合は、お知らせください。

You
ホームランを打っている左バッターの画像を生成してほしい。

これは野球の試合で左利きのバッターがホームランを打つイメージです。気に入ってくれるといいな!調整または追加したいことがあれば、お知らせください。

 左打者だったら嬉しかったんだけどな! でもありがとうよ。と、こんな感じで右投げ右打ちの選手しか生成されませんでした。

 この件については別の記事(肝心のリンクを忘れた)でコメントを頂いているのですが、やはり世の中は右利きが多いので、AIはデフォルトで右利きの人物を生成するようです。一応、訊いておきます。

You
あなたや、ほかのAIに左利きの人物の画像を生成させると、ほとんど右利きになる。何が原因なのだろう。
 

AIが画像生成する際に左利きの人物を右利きとして描いてしまう理由にはいくつかの可能性があります:

1. **データバイアス**:
AIモデルは、大量の画像データを基に訓練されています。右利きの人々が圧倒的に多い社会では、訓練データも右利きの画像が多く含まれる傾向があります。このため、モデルは右利きをデフォルトと認識しやすくなります。

2. **曖昧な指示**:
左利きを明示的に指示しない場合、AIはデフォルトのポーズや動作を選択するため、右利きの姿勢を生成しがちです。具体的に左手で何かをしているシーンを明確に指示する必要があります。

3. **認識の難しさ**:
左利きと右利きの区別が視覚的に明確でない場合、AIはどちらでもない「中立的な」ポーズを選ぶことがあります。そのため、意識的に左利きを描写するのは難しい場合があります。

4. **モデルの限界**:
現在のAIモデルの能力には限界があり、細かい指示を正確に反映できないことがあります。特に、利き手のような細かいディテールは見落とされやすいです。

次回、左利きの人物を生成する際には、より具体的に「左手でペンを持っている」や「左手で物を持っている」などの明確な動作を指示すると、より正確に生成される可能性が高まります。

You
過去にGPT-4を使って「左手でペンを持ち、右手は何も持っていない」と英語で指示したが右でペンを持っている人物の画像が生成された。

まだ完全に上手く生成されない場合、以下のように指示をさらに具体的にしてみると効果があるかもしれません。例えば、左手でペンを持つ姿勢や位置をさらに詳しく指定し、右手の位置や動作も具体的に指示します。

以下のように、指示をより詳細にして再度試してみます:

**英語の詳細な指示**:
```markdown
{
"prompt": "A person sitting at a desk, holding a pen in their left hand while writing on a piece of paper. Their right hand is resting on the table, holding nothing. The scene clearly shows that the pen is in the left hand, with the left hand positioned near the bottom left corner of the paper, and the right hand is placed flat on the desk."
}
```

この指示で再度画像を生成します。

 なぜか縦長で2枚生成されました。1枚目は左手で持ってはいますが、何者かが憑依しているのでしょうか。ちょっと怖い。
 
 どうしたものかと思っていたところ、実在する左利きの人を描かせればいいのでは? と思い至りましたが、肖像権の問題からか、実在の人物の描写は生成できないという旨の回答が来ました。ですよね。

 ただ、似た選手であればいいとのこと。というわけで、イチローのそっくりさんを生成してもらいました。ちなみにイチローは右利きです。

イチローのそっくりさん

 描写はいいんですが、ボールの位置に違和感。

大谷翔平のそっくりさん

 打球の位置と観客、チームメイトの視線が合っていませんが、直に改善されると願っています。

ベーブルース

 ベースボールは肖像権が切れているようで、直接プロンプトに「ホームランを打ったベーブルースの画像を生成してほしい」と打ち込んで生成されました。左打者の画像の出来はこれが一番いいですね。相変わらず打球の位置はバッターにかなり近い距離にありますが。

 最終手段としては、利き手は気にせずデフォルトで画像を生成し、左右を反転させる方法が手っ取り早いでしょうね。



この記事が参加している募集

#AIとやってみた

27,730件

この記事が気に入ったらサポートをしてみませんか?