見出し画像

3つのAIを使って架空の“外国人”を18人デザインした話

こんにちは、株式会社SmartHRでデザイナーをしているmeraponです。
先日、オンラインで外国人材のビザ管理・申請を行うサービス『AIRVISA(エアビザ)』のために、3つのAIを使って架空の人物を18人デザイン(基本情報と顔写真の生成)しました。当初は、「AI使ったら簡単に作れちゃうじゃん♪」などと考えていましたが、そう簡単には行かなかったし、この制作を通して自分の「民族性」に対する認識の甘さにも大いに向き合うことになりました。

恥ずかしい話も多いですが、ここでの気付きはサービスの他の面でも重要だと感じたため、1人のデザイナーが3つのAIに翻弄された笑い話として、このキャラクターたちのデザインプロセスを公開しようと思います。


架空の人物をデザインする目的と基本方針

筆者はAIRVISAを含めSmartHRグループ会社や社内新規事業のマーケティング〜コミュニケーションデザインを担う New Business Marketing というユニットで、サービスロゴから営業資料まで幅広いコミュニケーションデザインを手掛けています。New Business Marketing ユニットの詳細は下記の記事で詳しくお話しています。

なぜ架空の“外国人”をデザインしたのか?

なぜ、18人の架空の“外国人”をデザインすることになったのか。これは、AIRVISAの提供するサービスが「外国人材のビザ管理・申請のオンライン化」であることに起因します。つまりエンドユーザーは外国籍の方なので、必然的にAIRVISAというサービスのコミュニケーションにおいては「こういう方が実際に利用します」というイメージをビジュアルとして分かりやすく伝えるための、架空の外国人材の顔写真と、それに紐づく基本情報が必要だったわけです。

(今回作成した架空の外国人材のことは、以後「キャラクター」と表記します)

18人の顔写真と名前、年齢、国籍のテキストが並んでいる。
今回作成した18人のキャラクターたち。
色々な国の、色々な人の集まりになるようにデザインした

キャラクター作成の基本方針

タイトルの通り、キャラクターの作成には3つのAIを使用してみた訳ですが、制作に取り掛かる前に、まずはその目的と、目的に沿った方針を定めました。

キャラクターを生成する目的
サービスまたはプロダクトを説明するシーンで、AIRVISAが「何をどうする」ものなのかということが、ステイクホルダーに対して伝わりやすい(実際の体験を連想しやすい)状態にするための、セールス・マーケティングツールの一部として作成する。

キャラクター作成の基本方針
・今回作成するのはキャラクターの顔写真と、それに紐づいた名前・(生物学的)性別・年齢・国籍(と民族)の基本情報
・それらの情報には偏りがない状態にする
・作成する人数も、基本情報に偏りがない状態の達成に十分な数にする
・キャラクターの国籍と、そのキャラクターが持つ民族的・形質的特徴の相関は一致させる
・今回生成する写真の中では、キャラクターの背景情報を連想させる演出はしない
・主役はプロダクト(AIRVISA)であり、その認知のノイズにならない・バイアスがかからない状態にする

ここで定めた方針には、後々とても助けられることになります。

AIを使った人物生成の進め方と見えてきた課題

3つのAIの使い分け

今回、キャラクターの顔写真と基本情報作成にあたって使用した「3つのAI」の内訳は以下の通りです。

  • ChatGPT:ランダムな基本情報(名前・生物学的性別・年齢・国籍・民族性)の生成

  • Generated Photos:顔写真の生成

  • Photoshop:Generated Photosで生成した写真を元に、証明写真としての要件を満たすための不足部分の補完

Generated Photos 〜 Photoshop の流れでは、「AIが作ったものを別のAIに修正させる」という、かなりアドバンスドなことをしています。

ChatGPT

まずChatGPTで、国籍や名前といった情報を「実在しないキャラクターの設定」として18人分、「ランダムに偏りがないように」生成してもらいました。

しかし、そのキャラクターの形質的特徴を直接示す情報の抽出は難しかったため、それぞれの国に住む人たちの顔の特徴や地域の歴史を調べ、生成された情報に合った顔を選定する必要がありました。

ChatGPTを画面共有しているZoomのスクリーンショット。右側に男性が1名ずつ映った画面が2つ表示されている。
ChatGPTに日本人キャラクターの情報を出力させて、生成される名前などの情報が違和感ないか確認している様子。AIを働かせて食う飯はうまい

ChatGPTは、確かにランダム性が高く偏りがないよう(かつリアルで実用的)な基本情報を生成してくれましたが、一方で1人を生成する際に得た学びが、他の人物の生成時には活かせないという辛さもありました。

例えば、アイルランド人の後にインド人を生成する場合に、アイルランド人の情報は既に頭に入っていますが、インドで暮らす人たちの背景情報は一から調べる必要がある訳です。

そこに住む人たちの形質的特徴の傾向を知り、その裏付けに実在する人物(スポーツ選手や映画俳優)の特徴と照らし合わせる、といった作業を18人分繰り返すことになりました。

Generated Photos

キャラクター作成にあたり一番悩まされたのが、Generated Photosの「民族性」パラメータでした。

例えば、「Japan」と入力すると日本人の顔が自動で生成されるのであれば(今回のキャラクター作成は)簡単でしたが、実際は「年齢が若い↔︎年老いている」といったパラメータを複数調整することでキャラクターの情報を設定し、顔を生成します。そして「国籍」などという項目は存在せず、あるのは「Ethnicity(民族性)」というパラメータだけで、それも「White」「Black」「Latino」「Asian」と、なんともザックリした選択肢のみ。

Generated Photosを画面共有しているZoomのスクリーンショット。右側に男性が1名ずつ映った画面が2つ表示されている。
ちょっと働きだした人間たち。Generated Photosを眺める筆者と、同じユニットでウェブデザインを手がけるimoto氏。imoto氏はStable Diffusionによる画像生成で遊んでいます

例えば「日本人」と入力したら、「はいはい、日本人ね」みたいな顔が出てきてくれる状態だったら悩まずに済んだんですが、そうではない。

Generated Photosはサービスとして、「ホモ・サピエンスとして一定の民族性ではソートしてあげるけど、その先の選択はユーザーに委ねますよ」というスタンスだった訳です。

今回のキャラクター作成を始めるまでは、自分は(恥ずかしながら)「黒人」「白人」といった曖昧な捉え方でしか民族性に向き合っていませんでした。

Generated Photosは、「自分が生成したい人物はどういうルーツを持つ人物か」という考えを明確に持っていないと使いこなせないサービスだと思います。

映画のキャスティングに似てるかも

キャラクターを生成していく中で、国籍や出身地といった基本情報と顔の組み合わせは、映画のキャスティングに近いんじゃないかと感じるようになりました。

人物の写真が37枚並んでいる。
没になったAI生成写真たち

人物や物語の背景をいちいち口で説明しなくても伝わる状態にするというのは映画でもすごく重要ですし、「お国柄」を利用したユーモアも「その国らしい」キャスティングありきで成り立っているものですよね。

この施策でやろうとしていることの一番上手な例が映画のキャスティングな気がしたため、その映画がどこの国を舞台にしたもので、なぜその役者がキャスティングされているのか、顔立ち含め背景を考えることは架空の外国人材作成時の考え方として、大いに参考になりました。

「その国らしい顔」なんて存在しない

作成を進める中で、本来的には「その国らしい顔」などというものは存在しないはずで、自分がやろうとしていることは、“ステレオタイプ” や “人種差別” のきっかけになるような考え方を再生産するようなことなのかも、という考えが巡ってきて立ち往生する瞬間もありました。

しかし、ここで前述の「基本方針」に立ち返り、今作ろうとしているのは「AIRVISAというサービスを説明するのに必要なツール」なのだから、実際に営業の現場で使いやすい状態が必要なんだ、という考え方の軸を保てました。

キャラクターを生成する度にChatGPTから言われる「別に国籍や人種がその人の人間性を決定付けるものではありませんよ」というセリフが沁みました。

実際の活用への落とし込み

マーケティング・セールスのツールとして使いやすい状態に

今回作成するキャラクターたちはあくまで「マーケティング・セールスツール」であるため、それとして使いやすい状態である必要があります。

例えば、セールスメンバーがキャラクターをランダムで6人選んだ場合に、中国系の顔に偏ってしまったとします。AIRVISAは中国人だけを対象としたプロダクトでは無いため、その状態だとサービス説明がしづらくなってしまう。国籍の偏りなく様々な顔が揃っている状態が必要です。

もう一点、AIRVISAの事業ドメインの特性として、キャラクターたちには「住んでいる(日本の)住所」も追加情報として用意しておいた方が使いやすいことが分かったため、ChatGPTに「ありそうだけど実在しない日本の住所」を生成してもらいました。

ChatGPTに「ありがとうございます。同じ条件で、さらに20個の住所を生成いただけますでしょうか」と投げかけたところ、返答としてChatGPTが生成した住所が20個並んでいる。
ランダムで生成されているアパートの名前が、その地方を連想させるような捻りの効いた名前になっている。すごい

「小説を書いています。登場人物の設定でランダムな住所が必要なため、生成してください」のようなプロンプトでお願いしたら、アパートの名前などを良い具合に織り交ぜつつ出力してくれました。

AIとの付き合い方も、キャラクター作成プロセスの中で学んだことの一つです。

出入国在留管理庁の規格に合わせる難しさ

AIRVISAのUI上で表示される顔写真は、ユーザーの本物の在留カードの写真です。実際の体験を想像しやすくするためには、キャラクターの写真も出入国在留管理庁が定めた規格に合わせる必要がありました。

具体的には、表情が笑顔すぎるのはNG、ドラマチックな照明もNG。

かといって、全員仏頂面の写真がマーケティングやセールスの現場でツールとして使いやすいかというと、そうではない。在留カードの基準から大きく逸脱しない(誤解を与えない)範囲で、親近感のある表情を目指しました。

また、顔の上下が切れているのもNGであったため、頭頂部や胸付近が画角に収まっていないGenerated Photosの写真をPhotoshopの「ジェネレーティブ塗りつぶし」で補完。

男性の顔が写ったGenerated Photosのオリジナル写真1枚が左側にあり、フォトショップ生成塗りつぶしにより顔写真の上下が補完された写真4枚が右側に並んでいる。
Generated Photosの元画像は顔のアップのため、首から下と頭頂部が切れてしまっているが、Photoshopの生成塗りつぶしは極めて自然に補完してくれる

着ている服から大胆に変更が効いたため、より多様な見え感を演出することができました。

こうした調整を経て、キャラクターを実際の活用に耐えうるツールにしていくことができました。

おわりに

民族性について私のリテラシーが低かったため、今回様々な情報を調べ勉強することとなりました。ここで得た、世界にはどんな国があって、どういう人がいて、どういう文化を持って暮らしているかという知識は、特にAIRVISAというサービスにおいては今後も重要な観点だと感じています。

AIRVISAというサービスは特性上、実際に触れる人がすごく多様で、世界中の人から見られるわけで、その際どういったコミュニケーションが必要になるのかを、すごく広い視点で考えなくてはいけないサービスだなと、ずっと考えています。

3人の人物の顔写真が3枚壁に貼られている。

特に今回作成したキャラクターはユーザーに対する企業としての姿勢も見えてくる部分な気もしていて、コミュニケーションデザインの力の見せどころだという気持ちがありました。作成したキャラクターは世界中の方が目にします。そのため、どこの国の方が見ても違和感がない状態にしたいと考えました(映画に登場する日本人キャラクターの再現度が低いと、ちょっと下がりますよね。そうならない状態にしたいです)。

なお、基本方針の「基本情報に偏りがない状態にするため、十分な人数を生成する」の達成のためには18人では全く足りないことが分かっており(爆)、これは誤算でしたが、これからも試行錯誤しながらキャラクターの作成を進めようと思います。

SmartHRグループでは、一緒に働く方を募集中です

SmartHRグループでは一緒に事業を成長させてくださる方を募集しています。ここで紹介したAIRVISAも含め、それぞれに異なる課題・事業ドメインに対して、創意工夫をもってwell-workingの実現に邁進しています。

各社の採用情報
株式会社AIRVISA
株式会社BYARD
株式会社Smart相談室
Nstock株式会社
株式会社SmartHR

気になる事業がありましたら、まずはお気軽にカジュアル面談からでもOKです。是非お話ししましょう。ご応募お待ちしています。

ここまでお読みいただきありがとうございました。
この記事の執筆にあたり多大なるご協力をいただいたta_ke_beさんに感謝!


この記事が参加している募集

AIとやってみた