見出し画像

AI未経験者が、生成AIで「100人分の人物画像」を作成してみた話

こんにちは。SmartHRのコミュニケーションデザイナー、A5です。

みなさん、AI活用していますか?
私は今年の7月まで、AI関連のものを一切触ったことがなかったです。流行っていたChat GPTも触れていませんでした。
今回は、そんなChat GPTでさえ触ったことがなかった私が、突然「生成AIを使って人物画像を作成する」という業務の担当になり、生成AIと奮闘したことについて書いてみようと思います。

結論から言うと、想定していたよりも上手く早く仕上がりました。この業務がきっかけでAIをたくさん使うようになり、今では毎日お世話になっています。AI、いつもありがとう…。

まだAI関連をなんとなく使えてないな、という方がこの記事を通して活用するきっかけになればうれしいです。
使い慣れている方々は、奮闘する姿を生暖かく見守っていただけたらと思います。


生成AIで「人物画像を作成する」ことになった

この業務では、トンマナが揃った最低30人分くらいの人物の画像が必要でした。
なぜ生成AIで「人物画像を作成する」ことになったかと言うと、簡単に言うと「イチから人物を撮影すると、お金と時間がかかりすぎるから」です。

もし実際に撮影するとなると、モデル1人を撮影するだけでもかなりのお金と時間がかかります。それが今回は最低30人分。想像したくない…。(しかも、最低30人で、多ければ多いほど良いという内容でした)

30人分の人物撮影で発生する具体的な業務ってどんなものなのか、せっかくAIがテーマの記事なので、GoogleのAI「Gemini」に聞いてみました。

30人分のプロ仕様の撮影を行うとすると、具体的にどんな業務が発生しますか?

Gemini の回答

…回答はまだ続いていましたがトリミングしました

Geminiの回答のボリュームが思った以上に多かったです。改めてですが、最低30人分の人物の撮影をするとなるとこんなに大変なんですね…。

今回の業務では「完成度はそこそこ欲しい、けれど、お金はかけられない」ものだったので、「生成AIを使う」という手法がアイディアとして出たのです。

生成AIとの出会い

新しいもの好きの私ですが、冒頭でも書いたように、なんとなくAI関連は手が伸びていませんでした。
でも仕事なので向き合わないわけにはいきません。しかも私は新しいもの好きではあるので「仕事きっかけでAIを触ることができるなんて、なんてありがたい機会なんだ…」と思っていました。
(後で聞いたら、上司と同僚はそんな私をよく知っているので「A5なら楽しくやるでしょう!」という感じだったそうです。笑)

また、別の部署の方が似た取り組みを行っていたので、取り組むハードルも低かったです。
以下の記事には本当に助けられました…。ここでも感謝を申し上げます。この記事もとても面白いので、ぜひ読んでみてください。

今回どの生成AIサービスが適しているんだ…

生成AIのサービスはいろいろなサービスがたくさんあります。
そもそもどんなサービスが今回適しているのかをまず調べました。

今回の要件は以下です。

・ビジネス的条件
  ・商用利用可であること
  ・できるだけ価格が抑えられること
・人物画像の条件
  ・最低30人分くらいの人物画像
  ・国籍
    ・日本人8〜9割
    ・外国籍の人1〜2割
  ・世代・性別
    ・20代〜50代くらいまで幅広く
    ・特定の性別に偏らないように
・トンマナ・構図
  ・胸から上くらい
  ・SmartHRのアウトプットとして違和感がない

  • 今回詳しく調べたサービス

    • GENERATED PHOTOS:AIを活用して顔写真や全身モデルを自動で生成するオンラインサービス

    • Adobe FireFly:テキストを入力するだけで誰でも簡単に画像を生成することができるAdobe社が提供する画像生成AIツール

要件で比較してみました。

この時点で「Adobe FireFly」が今回の業務ではかなり優勢でした。弊社のクリエイターはAdobeのCreative Cloudコンプリートプランに入っているので無料ですし、商用利用が可だからです。どちらもとても大事なこと…。
あとは実際に「SmartHRのアウトプットとして違和感がない」を達成できるか、です。
それぞれのサービスを実際に試してみました。

GENERATED PHOTOSで生成できた画像の一部

いろんな人が撮影したようなリアルな質感の画像。顔のバリエーションが多い

Adobe FireFlyで生成できた画像の一部

プロのカメラマンが撮影したようなクオリティの高い画像。顔のバリエーションは少ない

Adobe FireFlyは元素材が少ないのか似た人物がたくさん出てきたのですが、Adobe Stockを元素材にしていることもあり、目指したいトンマナに近かったです。今回はビジネス的条件とトンマナの観点でAdobe FireFlyを採用することにしました。

AIさん、全然プロンプト通りに仕上げてくれないじゃん…

まずChat GPTに、業務の要件を満たした人物のプロフィールを用意してもらい、そのプロフィールを使用して人物画像を生成してみました。
最終のプロンプトまで試行錯誤したため全部紹介すると長くなってしまうので、生成の具体的な過程を1例だけお見せします。

目指したいトンマナ

SmartHRのウェブサイトなどで使用しているプロフィール画像です。この画像のように、明るくて自然な光になるような写真を目指しました(これはAIではなく、過去に撮影した実際の人物画像です)

Chat GPTにお願いしたプロフィールのひとつ
・山本 彩 (Yamamoto Aya)
  ・変に影響してしまわないように、名前はプロンプトに入れませんでした
・年齢:40歳
・性格:自由奔放で独立心が強い

これが最初に考えたプロンプトです。悪くないですが、もう少し自然にしたかったので指示を加えることにしました

プロンプトの修正 ①

プロンプトに「自然光」を追加。

なぜか着物姿になりました…。「自然」に引っかかったのかしら…。謎です。しかも光は逆にスタジオでライトを当てたような表現になり、逆に自然光からは遠くなってしまいました

プロンプトの修正 ②

「自然光」から「画像の光のコントラストを下げる」に変更。
「水色のシャツ」から「水色のブラウス」に変更しました。

照明が自然になった気がします。ただ「カメラ目線」の指示を聞いてくれなくなりました。照明の要素を活かしすぎたのかな…。カメラ目線以外の言葉の表現を試してみることにしました

プロンプトの修正 ③

「カメラ目線」から「正面を向く」に変更してみました。

角度の問題は解消されず…。なぜか背景に植物が現れました

プロンプトの修正 ④

プロンプトを「正面を向く」から「カメラ目線」に戻し「自然な笑顔」を追加しました。
また、指示が多いと反映されないのかな?と思い、「画像の光のコントラストを下げる」を削除してみました。

表情が柔らかくなった気がする…!後は気になるのは「生成AIで作った画像特有の美肌加工っぽい肌質」でした

プロンプトの修正 ⑤

プロンプトに「肌質をリアルに」を追加。

比較するとナチュラルにはなった気がします。生成AI特有の美肌加工っぽさが薄れたような気がします

これまでだと一番ナチュラルですし、このままずっとやっても終わりがない気がしたので、基本はこのプロンプトで行こうと決めました(諦めも肝心)。プロンプトの修正は大きく5回(記載していない微調整を入れると、8回ほど)である程度完成しました。
「思ったよりいい感じに出来たな〜。この調子だな〜」と思っていたのですが、また大きめな壁にぶつかります…。

全員「某恋愛リアリティーショー」出演者になってしまう問題

試作したものを並べて、周りの人に見てもらいました。

何か見たことがある雰囲気…

「写真のトンマナはある程度クリアできているなと思うけれど…、全員、バチェラーに出てきそうなビジュアルをしてる!!!

あ!…確かに………。
参加者紹介の画像に似ている気がする…!!

私の働いている部署は、みんな恋愛リアリティーショーが好きなのもありとてもわかりやすい例えで、見せた全員がこの感想に納得でした。笑

試作した画像の人々は集まるとちょっとリアリティがなく、今回の要件を満たせていませんでした。

と考えると、現在のアウトプットには「身近さ・親しみやすさが足りない」ということかなと思いました。バチェラーの出演者には「キラキラ」「憧れ」の要素があると思うからです。
人の印象における「身近さ・親しみやすさとはどんな要素なのか」について、また考えることに…。

いろいろと考えていった結果、「身近さ」とは「特徴になるような要素」ではないか?と行き着きました。例えば「似顔絵で誇張されて描かれるような部分」です。
「人間の平均顔は美しい」という考えを目にしたことも確かにあります。

特徴になるような要素として考えたもの
・パーツの大小
・パーツの位置
・髪型
・体型

以上の要素をプロンプトに入れていくと、上手く「身近さ・親しみやすさ」が出てくれて、要件をクリアできた成果物ができました!すべてをお見せできないのですが、以下のようなイメージです。

実際に会社で働いていそうな人物の雰囲気になりました

メンバーで「生成AIを触ってみる会」をした

当時は部署内で生成AIを触ったことがないというメンバーが多かったので、今回の業務ではできるだけ人物画像の量が欲しかったのもありメンバーに協力してもらいつつ、生成AIを触るきっかけになることを目的とした「生成AIを触ってみる会」を行いました。

「生成AIを触ってみる会」は、業務の目的・Abobe FireFlyの使い方・自分が試して最良だったプロンプトを共有し、Figjamを会場にして、メンバーで「あ〜だこ〜だ」言いながら、それぞれが試したプロンプトをシェアし合いながら進めました。

会場はこんな感じ。生成した画像はもっともっとたくさんあります

この会では、目的だった「人物画像の量」と「メンバーが生成AIを触るきっかけ」が達成できたのはもちろん、それぞれ新たなプロンプトへの挑戦をしてくれ、新たな知見になりました
人それぞれ生成AIでもアウトプットに差が顕著に出るのが興味深かったです。

「生成AIを触ってみる会」でのメンバーのアウトプットや知見によりスムーズに進行したことで、当初は30人分の作成の予定が最終100人分を想定工数内で作成することができました

みんなでやれば、怖くない

新しい技術に挑戦するのはやっぱりハードルが高いなと思います。コストが掛かることも多いし、勉強もしないといけないし、勉強するにも良い記事を探したり、時間もかかります。
でも、少しでもきっかけがあったり、近くに知見がある人がいたりしたら、そのハードルは下がるのではないでしょうか。
はじめて挑戦する技術も、周囲の同僚や友人を巻き込んで一緒にやってみると、一人でやるよりもハードルが下がったり知見が得られやすいなと思うので、ハードル高いな〜と一歩踏み出せていない方はぜひ誰かと挑戦してみてください!

冒頭で書いたことと被りますが、私はこの業務をきっかけに、Chat GPTをはじめ、GeminiもAdobe FireFlyも愛用しています。
Adobe FireFlyはこの業務を行ったとき(2024年8月くらい)よりもさらに進化して面白くなっていて、さらに活用できるようになっています。きっと同じことをしてもアウトプットはまた違うかもしれません。笑

みんなでやれば怖くない!みなさまがAIをより効果的に使うためのヒントとして、この記事の内容がお役に立てればうれしいです。
ここまでお読みいただきありがとうございました。
AI活用生活を楽しみましょう〜!

この記事が参加している募集