見出し画像

Bing ChatのWeb検索とDALL-E3の画像生成を組み合わせて自動化する

Last update 10-29-2023




▼ 本記事について

概要

 2023年9月下旬に、OpenAI製の画像生成AIであるDALL-E3(DALL-Eはダリ と読む)が公開されました。プロンプトに忠実で品質の良い多彩な出力が得られるため、話題になっています。出力画像は、X(旧Twitter)のハッシュタグ #DALLE3を検索すると良いでしょう。

DALL-E3の出力例(上下トリミング済み、元画像は1024x1024)
https://twitter.com/riddi0909/status/1709480541094052348 参照

 本記事では、Microsoft Bing(以下、Bing)のChatやImage Creatorを使って生成する方法を説明しています。無料ですのでぜひ試してみてください。なお、Microsoftアカウントと、Microsoft Edge(PC)またはBingアプリ(Android,iOS)が必要です。執筆時点では、生成した画像の使用が非商用に限定されているため、注意してください。

参考

 Bing以外では、有料のChatGPT Plusで生成できます。違いは、「出力そのものの質が異なる(上記の画像はBingです)」「同じプロンプトとSeedsからは同じ画像が出力される(若干の揺らぎあり)」「縦長と横長を追加した3サイズがある」「プロンプトの最大長が異なる」「PNG形式で出力される」…等です。

 DALL-Eの仕組みは、とーふのかけら氏の解説をご覧ください。ただし、Stable Diffusionの仕組みが理解できる程度の知識が必要です。

おまけ

 有料のChatGPT plusをご利用の方は、下記の記事もどうぞ。

 上記以外の情報は、下記のメニューより「DALL-E3/ChatGPT関連」へ進んで、各記事を参照してください。



▼ Bing Image Creator

 先に、Bing Image Creatorを紹介します。こちらでは、好みのプロンプト(テキストの説明)を直接入力して生成ができます。Bing Chatで生成した画像も、こちらにストックされます。

始める手順

 Microsoft Edgeの場合は、https://www.bing.com/images/create/ へアクセスしてください。Bingアプリの場合は起動後、「アプリ」の中に「Bing Image Creator」があるのでアイコンをタップしてください。

画面の説明

 Microsoft Edgeの画面を使用します。Bingアプリもほぼ同様です。

Bing Image Creatorの画面

 左上のプロンプト欄には、生成したい画像のプロンプト(説明文)を入力します。日本語も対応しています(内部のプロンプトは英語だそうです)。右隣の「⚡」はブーストで、1回生成すると1減ります。0になった場合は、混み具合によって使える時と使えない時があります。執筆時点では、毎日きまった時間に最大値の15(10-21-2023現在)に戻ります。

 起動直後は「アイデアを探す」が選択されていて、「作品」を選択すると自身が生成した画像が表示されます。画像のサムネイルをクリックすると詳細が表示され、共有リンクの生成、コレクションへの保存、ダウンロードができます。

 右側には履歴があり、過去の生成画像を参照できます。ただし履歴の数は少なく、流れてしまった画像を参照する方法は無さそうです。ご注意ください。

 参考まで、上記画像のプロンプトは「A young girl is enjoying a new trendy lunch menu, a 'Tofu and Vegetable Stir-fry Bowl', at a popular cafe in Tokyo. The cafe is bustling with people, and the girl's face lights up with delight as she takes her first bite. The scene is depicted in an anime illustration style.」です。こちらは自由にご利用ください。

生成方法

 テキストエリアにプロンプトを入力して、「生成」をクリックしてください。生成はバックグラウンドで実行され、ブーストを使用すると10秒程度で完了します。生成は1回あたり4枚を同時に行いますが、出力は3枚以下の場合があります。1枚も生成できなかった時は、ブーストは減りません。

 プロンプトや生成画像には制約があります。悪質とみなされた場合はペナルティを科される恐れがあります。ポリシーに反しない、健全な内容を心がけてください。



▼ Bing Chatで生成を自動化(説明)

概要

 Bing Chatは、ChatGPTがベースになっており、画像生成にも対応しています。しかし、対話しながらの指示は手間がかかり、やり方によっては希望どおりのリクエストが行えない可能性があります(Bing Chatが自律的にプロンプトを作って生成に回すため)。

 本記事で紹介する指示文は、1回の要求で画像生成まで完了できるように設計しています(生成を実行してくれない場合もあります)。いくつかのバリエーションを用意したので、ぜひご活用ください。

補足

 どのようなプロンプトを作りたいかによって指示文が変わるため、基本的には指示文の書き換えや改造が必要です。本記事を参考に、お好みの指示文を作ってみてください。なお、あまり複雑にするとうまく動作しないかもしれません。

注意点

 当然ながら、Bing Chat上で画像を生成するとブーストを消費します。多少の動作確認は行いましたが、必ずしも希望通りの動作になるとは限りません。うまく動作していないと思ったら、画像を生成する前に停止して新規のチャットでやり直すと良いでしょう。掲載した指示文は予告なく改良、変更する場合があります。

Bing Chatを始める手順

 PC版のMicrosoft Edgeの場合は、https://www.bing.com/ へアクセスして、「チャット」へ進んでください。進んだ後のURLもおそらく有効(ブックマーク可能)です。

Microsoft Bingの「チャット」へ進む

 Windowsでは、ブラウザの閲覧から独立したチャットも利用できます。ただし、こちらは履歴が残らないようです。Microsoft Edgeのウインドウの右上にあるアイコンをクリックしてください。デタッチした場合はデスクトップ上にあります。

チャットのアイコンをクリックする

 Bingアプリの場合は起動後、画面下の中央にある「チャット」をタップしてください。

アプリの場合は「チャット」が表示されている



▼ Bing Chatで生成を自動化(例1)

 Web検索した内容をもとにプロンプトを構成し、画像を生成します。たった1回の指示のみで完了します。画像の生成が実行されなかった場合は、「先ほどのプロンプトで画像を1枚生成してください」等の指示を追加で行ってください。

 生成にWeb検索を用いることで、Bing Chatが持っていないリアルな情報が投入されて、表現の幅が広がると考えています(1-3にてスイカゲームの画面を想像で生成しています)。また、指示文の「」内を書き換えるだけで多彩な画像が作成できることも特徴です。本記事の指示文を参考に、自由な発想で挑戦してみてください。


◆ 1-1:女子の昼食(rev. 11-231006)

 必ず新規のチャットで始めてください。下記の指示文をコピー&ペーストしてください。なお、動作確認は「より厳密に」のスタイルで行いました。GPT-4が選択できる場合は、そちらをご利用ください。

(---指示文ここから---)

(1) 「大阪で人気のカフェランチメニュー」を調べて3文で説明してください。それを参考にしたカフェランチメニューを1つ考案して表示してください。固有名詞は削除してください。
(2) (1)で表示した内容をもとに、10代女子が登場するイラストの説明(容姿、動作、場所、背景を含む)を3文で作って、「anime illustration」の画風指定を追加した英語のプロンプトを表示してください。
(3) (2)で表示したプロンプトの画像を1枚生成してください。

(---指示文ここまで---)

1-1実行例
1-1生成画像の例
プロンプトは「A teenage girl is sitting at a cafe in Osaka, enjoying a popular lunch menu. She has a trendy hairstyle and is dressed in casual, fashionable clothes. She is happily eating her meal, which is beautifully presented on the table in front of her. The cafe has a modern and stylish interior, with other customers chatting and enjoying their meals in the background. The style of the illustration is anime.」


◆ 1-2:女子のレジャー(rev. 12-231006)

 1-1から些細な変更を加えたのみです。必ず新規のチャットで始めてください。下記の指示文をコピー&ペーストしてください。なお、動作確認は「より厳密に」のスタイルで行いました。GPT-4が選択できる場合は、そちらをご利用ください。

(---指示文ここから---)

(1) 「東京で女子に人気のレジャースポット」を調べた結果を参考に、東京でのレジャーを考案して表示してください。
(2) (1)で表示した内容をもとに、10代女子が登場するイラストの説明(容姿、動作、場所、背景を含む)を3文で作って、「anime illustration」の画風指定を追加した英語のプロンプトを表示してください。
(3) (2)で表示したプロンプトの画像を1枚生成してください。

(---指示文ここまで---)

1-2実行例(生成は失敗)

 上記画面のように、生成を試みて失敗する場合があります。「先ほどのプロンプトで画像を1枚生成してください」と指示するか、プロンプトをコピーしてBing Image Creatorで生成してください。プロンプトの内容によっては、何度行っても生成できない場合があります。

 上記のプロンプトをBing Image Creatorで使用してみたところ、1枚だけ生成されました。

1-2生成画像
プロンプトは「A group of teenage girls are taking photos at the Asakusa Temple. They are dressed in trendy clothes, their faces filled with excitement and curiosity. In the background, the Tokyo Skytree® can be seen, creating a vibrant and lively atmosphere. The style of the illustration is anime.」


◆ 1-3:女の子がゲームで遊ぶ(rev. 13-231006)

 望んだプロンプトが出力されるよう、指示文にアレンジを加えました。必ず新規のチャットで始めてください。下記の指示文をコピー&ペーストしてください。なお、動作確認は「より厳密に」のスタイルで行いました。GPT-4が選択できる場合は、そちらをご利用ください。

(---指示文ここから---)

(1) 「VTuberの間で流行っているゲーム」を調べて、ゲーム画面に映っている詳細な内容を2文で表示してください。
(2) 10代の女の子が遊ぶゲームの画面を(1)で表示した内容にして、イラスト全体の画風を「anime illustration」で指定したプロンプトを英語2文で表示してください。固有名詞は別の表現で置き換えてください。
(3) (2)で表示したプロンプトの画像を1枚生成してください。

(---指示文ここまで---)

1-3実行例
1-3生成画像
プロンプトは「A teenage girl is playing a popular game among VTubers. The game screen shows various fruits falling from the top, which combine to form larger fruits when they touch each other. The ultimate goal is to create a giant watermelon that fills the screen. The style of the illustration is reminiscent of anime.」



▼ Bing Chatで生成を自動化(例2)

 Web検索を行わず、Bing Chatの知識のみでプロンプトを作成するバージョンです。現在、2-2以降を準備中です。画像の生成が実行されなかった場合は、「先ほどのプロンプトで画像を1枚生成してください」等の指示を追加で行ってください。


◆ 2-1:欲しい要素を指定して創作(rev. 21-231010a)

 こちらは「」内を好みの内容に設定するだけで詳細を決めてくれる汎用的な仕組みです。必ず新規のチャットで始めてください(以降の動作は未確認)。下記の指示文をコピー&ペーストしてください。なお、動作確認は「より厳密に」のスタイルで行いました。GPT-4が選択できる場合は、そちらをご利用ください。

※現在、(2) で表示されたプロンプトと、実際の生成に使用したプロンプトが必ずしも一致するわけではない事を確認しています。大きな支障はありませんがご了承ください。

(---指示文ここから---)

注意:コンテンツポリシーに反しないよう、安全かつ適切な内容で生成してください。
(1) 「知らない町の商店街」「pigtailの女の子とゴールデンレトリバー」「白のセーラー服と紺のスカート」をベースに「3つ」の要素を追加して、3文で構成された「あたたかく意外で映画みたいな」ストーリーを考案してください。
(2) 4文で構成された「英語の」画像プロンプト(色、場面、人物、動作、背景、ムード、視点などを詳細に)を考案して表示してください。条件として、「color anime illustration」を先頭に加え、(1)のストーリーを使用してください。
(3) 1枚の画像を作ってください。

(---指示文ここまで---)

2-1実行例
2-1生成画像の例
プロンプトは「color anime illustration of a pigtailed girl in a white sailor suit and navy blue skirt, walking with a golden retriever down the shopping street of an unfamiliar town. The sun is setting, casting a warm glow on the cobblestone streets. The girl is holding a red balloon in her hand, and the dog has a matching red bow around its neck. They are both looking up at the sky, where a flock of birds is flying in a V formation.」



▼ 指示文の改造について

 本記事に掲載した指示文やプロンプトの使用、改良、投稿や掲載は自由です。むしろ、より使いこなしていただければ本望です。

 なお、指示文がうまく動くまで何度も変更を重ねました。挙動が理解できるまでは、簡単な改造にとどめるのが良いでしょう。「」内を書き換えるだけでも、様々な画像が生成できるはずです。

 プロンプトは作成するのに、画像の生成を行わずに終わってしまうことがあります。追加で「先ほどのプロンプトで画像を1枚生成してください」と指示するか、プロンプトをコピーしてBing Image Creatorで生成してください。逆に、動作テストのために生成して欲しくない場合は、「(3) 画像は生成しないでください。」に差し替えてみてください。

 指示文に入っている設定は、好みで変更してみてください。固有名詞を使用させるかどうかは、状況に応じて判断してください。個人的に、特定の人物やキャラクターを表示させることはあまり好ましくないと考えています。

 また、Bing ChatやChatGPTは出力する文の長さを制御することが難しいため、「3文で」等の指示を与えています。文の数を変更すると、簡単に情報量を変化させることができます。「○○を詳細に」「○○を簡潔に」等の指示も良いでしょう。 

 センシティブな内容などポリシーに反する場合は、プロンプト作成や画像生成を拒まれる可能性があります。それによってペナルティを科されないよう、ご注意ください。



▼ おまけ:表紙画像について

 指示文は1-1を使用し、「人気の映えスイーツ」に書き換えました。長いプロンプトの内容が、忠実に再現されていることがわかります。

プロンプトは「A teenage girl is sitting in a cafe, enjoying a lunch menu inspired by popular desserts. She has a bright smile on her face as she takes a bite of her meal. The cafe is bustling with people and the decor is modern and chic. The girl is stylishly dressed and her eyes sparkle with delight as she savors her food. The background is filled with the chatter of other customers and the aroma of delicious food wafting through the air. The style of the illustration is anime.」
プロンプトは同上
プロンプトは同上(見切れて表示されていない1枚)



▼ 以前の指示文

 いったん掲載したあと取り下げたものや、バージョンアップ前のものをこちらに残しておきます。


◆ 欲しい要素を指定して創作(rev. 21-231007b)

 画像生成まで実行してくれる確率が低いので取り下げました。もちろん、追加で「先ほどのプロンプトで画像を1枚生成してください」と指示すれば生成してくれます。

(---指示文ここから---)

(1) 次の要素、「色彩豊かで幻想的な深海」「廃墟の遊園地」「マーメイドが登場」などを用いた少し詳細なストーリーを考案して3文で表示してください。
(2) (1)で表示した内容のイラストの説明(容姿、動作、場所、背景を含む)を3文で作って、「子供が描いたラフなカラーイラスト、」を冒頭に追加した日本語のプロンプトを表示してください。
(3) (2)で表示したプロンプトで、イラストの生成を1回実行してください。

(---指示文ここまで---)

実行例
プロンプトは「子供が描いたラフなカラーイラスト、深海の底には色彩豊かな生物が溢れ、その中には美しいマーメイドが住んでいます。彼女は廃墟と化した遊園地を探索しています。周りには錆びた観覧車やジェットコースターが見え、かつて人々が楽しんでいたことを想像させます。」


◆連想で作る女子の昼食(rev. 21-231007)

 画像生成まで実行してくれる確率が低いので取り下げました。もちろん、追加で「先ほどのプロンプトで画像を1枚生成してください」と指示すれば生成してくれます。

(---指示文ここから---)

(1) 「ハンガリーで人気のカフェランチ」から連想される「メニュー」を1つ考案して表示してください。
(2) (1)で表示した内容をもとに、「女性司祭」が登場するイラストの説明(容姿、動作、場所、背景を含む)を作って、イラスト全体の画風を「anime illustration」で指定したプロンプトを英語2文で表示してください。
(3) (2)で表示したプロンプトの画像を1枚生成してください。

(---指示文ここまで---)

実行例
プロンプトは「A female priest is sitting in a popular Hungarian cafe, enjoying a bowl of goulash soup with a side of freshly baked bread. She is wearing a simple, yet elegant robe, her hair is neatly tied back, and she has a kind smile on her face. The cafe is bustling with people, and the aroma of coffee fills the air. The style of the illustration is anime.」



▼ その他

 私が書いた他の記事は、メニューよりたどってください。

 noteのアカウントはメインの@Mayu_Hiraizumiに紐付けていますが、記事に関することはサブアカウントの@riddi0908までお願いします。


この記事が気に入ったらサポートをしてみませんか?