見出し画像

AI画像生成でプロフィールのアイコンを作成してみる

はじめまして。シーラルと申します。
特にこれといった趣味もなく、興味があってもなかなか「始めてみよう!」となることはありませんでした。そんな私でしたが、最近になってAI画像生成というものに興味を持ちはじめ、同時にnoteというサービスの存在も知りました。これまで何もチャレンジしてこなかった人生でしたが、それでいいのだろうか?と疑問に思いはじめ、何事も挑戦だよ!と、これまで幾度となく頂いたアドバイスをここにきて実行しようと決意しました。

AIに関しては完全な素人ですし、それどころかITやパソコンの知識も全くありません。かといってイラストや写真に詳しいわけでもありません。たくさん調べて、実際に使っていきながら徐々に慣れていけたらなと思っています。


AI画像生成ツールを選定する

AI画像生成と言っても、たくさんのツールがあることを知りました。
以下が代表的な画像生成AIのツールのようです。

  • Stable Diffusion

  • Midjourney

  • DALL·E 3

  • Bing Image Creator

これらは画像生成モデルと呼ばれており、それぞれで学習する画像、学習の方法、画像生成する方法が異なり得意分野が違ったりするようです。
また、Webサービスを介して画像生成をするというのも、一般的な手法のようで、さまざまなサービスがあることがわかりました。
ただし、やっぱり高機能な生成AIは有料サービスがほとんどのようです。うーん、もちろん有用なサービスに課金するのは有意義なことだと思いますが、まだ何も理解していない私が課金するのは時期早々なのは間違いありません、、、が、せっかくやる気になったんだから失敗しても授業料だと思い、課金してみますか!という思いで、サービスを利用してみました。

DreamStudioを使ってみた

DreamStudioというWebサービスがあり、画像生成にはStable Diffusionを使用しているようです(そもそもDreamStudioをオープンソース化したものがStable Diffusionとのこと)。こちら、アカウント作成すると25クレジット分(125枚)が無料で使えます。

こんな感じの画面になります。
左のタブでどのような画像を出したいか指示しています。Styleでは「アニメ調」、「リアル」、「3D」など10種類以上から選ぶことができます。Promptは今回の例ですと、川や山といった具体的なオブジェクトの指示をしており、人物の画像を作るのであれば服装、髪型、表情、ポーズを指示できます。Negative promptでは逆に描写してほしくない表現を入れます。プロンプトは強調したり、AIに認識して貰いやすい単語があり、画像生成の肝と言える要素のようで、かなり奥が深そうです。また、日本語より英語の方がイメージ通りの指示がしやすいとのこと。
更に、追加学習モデル(RoLAなど)を使用することで、より詳細で狙い通りの描写が可能になるようです。そのほか、指定した画像をもとに画像を生成するi2i(image to image)という手法もあります。

と、ここまでやってみて、、、ムズカシイ!ワカラナイ!!
奥が深くてすごく楽しそうですが、いかんせん頭があまりよくないので、、
どうしよう、興味があって勉強したいけど早くnoteを始めたい。でも、noteのプロフィール画像はAIで作成したい!

もっと簡単に画像生成できるサービスがないか探してみよう。

DALL·E(ChatGPT)を使ってみた

簡単なサービスを、と探してみると対話形式で質問や文章作成などを行ってくれるChatGPTに画像生成の機能が追加されたという記事を見つけました。結論、今回のプロフィール画像はChatGPTを使用しています。が、これが思ったより難しく、それでも対話形式ということもありすごく楽しく使用することができました。

ChatGPTは日本語の認識能力が高いため、こちらの要求が伝わりやすいというメリットがあります。対話の要領で出したい画像を伝え、その情報からDALL·Eで画像生成をしてくれます。細かな調整がどこまでできるか分かりませんが、初心者が画像生成AIに触れるのにはうってつけです。しかし、こちらの画像生成の機能を使うには月額20$と決して安くありません。
でも今回、「せっかくやる気になったんだから失敗しても授業料だと思い、課金してみますか!」という気概ですので払っちゃいました(笑)
有料版のメリットはいくつかあり、以下がその一部です。

  1. 画像生成、画像入力ができる

  2. 最新バージョンのChatGPT-4が使用できる。

  3. 使用文字制限、使用回数が緩和される

  4. 応答速度が速い

まずはやっぱり、画像生成。
対話で画像が作成できるって素晴らしいです。
試しに使ってみよう。

「日本の田舎、夏、川、山、複数の民家、風景」と簡易的な内容を伝えたら10秒程度で画像が作成されました。

絵の雰囲気を変えたかったため、リアルに描いてほしいとお願いしました。

できた!すごい、私でも思ったような画像を生成することができる!
ワクワクが止まりませんが、こいつは後でじっくり遊ぶことにします。

画像生成以外のメリットとしてChatGPT-4が利用できるようになるのが、私的には大きかったです。無料版の3.5を利用したことがあり、確かに「すごい!世の中にこんな技術があったんだ!」と感動しましたが、回答の精度としては不十分なことも多々ありました。ChatGPT-4では、回答の精度がかなり向上しているのを実感でき、また、ネットから情報を集めて回答する機能もあるようで、最新の情報にも対応できています。

これだけでも月額20$に見合っていると思いました。更に画像生成までできてしまうなんて、、、夢のような時代になったものです。
ちなみにMicrosoft社が提供する「Bing Image Creator」という画像生成AIのツールがあり、こちらも対話形式で画像生成することができ、無料でも使用できるようです。

え~無料で使えるの?そんなものがあったの!?とこの記事を書いている途中に気づきました。かなり有名なようですし、確かに画像生成AIを調べてるときに何度も見ましたが、なんかわからないけど難しそう!って見て見ぬふりしていました。ChatGPTは当時先進的だったためニュースでも多く取り上げられおり、私も3.5を利用したことがあるという親近感からChatGPTに行きついちゃいました。Bing Image Creatorについては、ほとんど調べていませんが私のような初心者はまずはこちらを試してもよかったかもしれませんね。
とはいえChatGPT先生に授業代を支払ったので、ガッツリ使っていきたいと思います!

プロフィールのアイコン作成

さて、さっそく楽しみにしていたChatGPTを使用しての画像生成の時間がやってきました。アイコンは自分を象徴するような画像を使用するのが一般的だと思いますが、特に何か趣味があるわけでもないですし、写真やイラストにも精通していません。うーん、どうしようかなぁ。と思いながらも、漠然と可愛らしくもあり、少し不気味な雰囲気のキャラクターの画像を作ってみたいなと思っていました。どういうイメージで伝えるのがいいか分からなかったのですが、とりあえずそのまま「可愛らしくもあり、少し不気味な雰囲気のキャラクターの画像」を作ってほしいと伝えました。

確かにそうなんだけど、そうじゃない!
私のイメージとは違いました。さすがに指示が雑すぎますね。この絵のテイストをベースに修正していくこともできそうですが、少し想定と外れすぎているのでもう少し違う指示をしてみました。かといって明確な画像のイメージがあるわけでもないため、ざっくりとした指示で生成された画像を眺めて、自分が作りたい絵はいったい何なのか?をアシストして貰いながら画像生成を繰り返しました。

指示「不気味で少し悪そうなキャラ、暗いイメージ、絵本に出てくる」

指示「もう少し可愛い感じで、背景を暗い森にして!」

指示「もっとミステリアスで禍々しい感じにして!」

おや、、?これです!!これが欲しかったんです!!!
試行錯誤した回数は10回程度。なんだ簡単じゃーん、なんてこの時は思いました。直後、ヘッダー画像を作るのにどれだけ苦労したかは当時の私はまだ知りません、、、涙
試行回数10回で自分が欲しい画像が生成されたのは、かなり運がよかったと思います。ChatGPTへの指示もかなり雑な段階でしたので。
ちなみにこの画像は、テキストベースのやり取りを基にDALL·Eにプロンプトやその他パラメータを指示していると思いますので、試しにプロンプトを聞いてみました。英語なので翻訳してみると、

なるほど、どう変換されてこういうプロンプトになったかは分かりませんが、確かに画像から想像される内容ではあります。
次に再現性を確認してみます。このプロンプトを使用して再度画像を生成するようにお願いしました。

再現性は高いとは言えないですね。でもこれがAI画像生成の面白さでもあります。唯一無二の画像が作れるわけですからね。将来的にはプロフィールアイコンの子を冒険させるような絵本とか作れないかなぁと夢は膨らみますが、それはまた違う技術が必要そうです。キャラクターはそのままで動きのみを変える、みたいなこともできるのかな?まだまだ知らないことばかりなので、これからたくさん勉強しないとです。

AI画像生成を実践してみての感想

初めてのことばかりで戸惑いも多かったですが、率直な感想は「めちゃくちゃ楽しい」です。ゼロからのスタートだったので、少し調べたり、少し使ってみるだけでも成長が感じられました。といっても、AI画像生成についての知識は5%にも満たないと思っています。それとChatGPTに代表される対話形式のAIも奥が深いことが分かり、これからはプロンプトエンジニアリング(AIに自分の意図が伝わるような指示や質問をする技術)が重要になってくる時代が来るとのことです。これは使っていて実感できましたが、AIがより正確な情報や画像を提供するためには、詳細かつAIに向いているフォーマットで指示、質問ができているか否かで答えが全く変わってきます。奥が深いし進化のスピードも速いAI関連技術ですが、だからこそ趣味としてはうってつけなのです。一生付き合っていけるとても楽しい趣味だと思いました。
今後も画像生成やテキスト生成についての知識を深め、もっとクオリティの高い創作ができるよう精進してまいります。
AIを利用して画像生成、小説、絵本、マンガとやってみたいことがたくさんあります!これから成長記録をどんどん発信していけたらと思いますのでよろしくお願いいたします。

次回はヘッダー画像作成奮闘記について書きたいと思います。
本当に苦労しました、、、拙い文章を読んでいただきありがとうございました!ではでは~

この記事が参加している募集

#AIとやってみた

27,805件

この記事が気に入ったらサポートをしてみませんか?