見出し画像

【Midjourney】英語解説を日本語で読む【2023年3月27日|@Samson Vowles - Delightful Design】

Midjourneyの解説です。
公開日:2023年3月27日
※動画を再生してから、インタビューを読むのがオススメです。


We're going to be putting Midjourney version 5 and ChatGPT-4 together to harness the great powers that they contain.

Midjourneyバージョン5とChatGPT-4を一緒にして、それらが持つ偉大な力を利用するつもりです。

And we're going to be building better prompts and making the most of these new technologies.

そして、より良いプロンプトを作り、この新しい技術を最大限に活用します。

We can imagine ChatGPT-4 as a wise wizard who has trained for many years.

ChatGPT-4は、長年修行を積んできた賢者のようなものだと想像できます。

We can go to the wise wizard and ask him to define us an articulate and specific prompt for different contexts.

その魔法使いのもとへ行き、さまざまな文脈に対応した明確で具体的なプロンプトを定義してもらうことができるのです。

Dear wizard, can you give me a prompt for a sweet lady protagonist for my film about cheese?

親愛なる魔法使い様、チーズを題材にした私の映画の主人公に、甘い女性のプロンプトをお願いできますか?

Of course, young Padawan.

もちろんだ、若きパダワンよ。

Just put 8k at the end.

ただ、最後に8kと入れてください。

To perform this process, we will train ChatGPT-4 in the art of prompt writing and help refine its outputs.

このプロセスを実行するために、ChatGPT-4にプロンプトの書き方をトレーニングし、そのアウトプットを洗練させるお手伝いをします。

After this, we'll look at how these prompts come out in Midjourney and look for ways to improve our prompt writing wizard.

その後、このプロンプトがMidjourneyでどのように出力されるかを見て、プロンプト作成ウィザードを改善する方法を探します。

So let's dive right in.

では、さっそく始めてみましょう。

The first step is to come to ChatGPT.

最初のステップは、ChatGPTにアクセスすることです。

Make sure we set the model to ChatGPT-4 and start a new conversation.

モデルをChatGPT-4に設定し、新しい会話を開始します。

And what we're going to do is we're going to prime ChatGPT-4 to act as our wizard prompt writer.

そして、ChatGPT-4をプロンプト作成ウィザードとして使用するように設定します。

And to do that, I'm going to inform it that you need to act as a prompt engineer.

そのために、プロンプトエンジニアとして行動する必要があることを通知します。

You will write me prompts for an AI art generator called Midjourney.

MidjourneyというAIアートジェネレーターのプロンプトを書くんだ。

I will provide you with short content ideas, and your job is to elaborate these into full, explicit, coherent prompts.

私はあなたに短いコンテンツのアイデアを提供し、あなたの仕事は、それを完全で明確で首尾一貫したプロンプトに練り上げることです。

So here I've defined the task.

ここで、私はタスクを定義した。

I've told it what it's going to act is.

何をするのか、その内容を伝えました。

And now I'm giving it more context around what an AI art generator is, what a prompt is, and how I would like the response formatted.

そして今、AIアートジェネレーターとは何か、プロンプトとは何か、どのような形式で回答してほしいか、といった文脈を与えています。

Prompts involve describing the content and style of images.

プロンプトは、画像の内容やスタイルを説明するものです。

It is useful to be explicit and use references to popular culture, artists, and mediums.

大衆文化、芸術家、メディアへの言及を明示することが有効です。

Your focus needs to be on nouns and adjectives.

名詞と形容詞に焦点を当てる必要があります。

This prevents ChatGPT from going off and describing in flowery ways the vacant gaze that somebody's having that reminds them of the first day of autumn.

これは、ChatGPTが、秋の初日を思い起こさせるような、誰かの空虚な視線を花言葉のように表現してしまうのを防ぐためです。

And we're asking ChatGPT to actually define what that would look like.

そして、ChatGPTには、それがどのようなものかを実際に定義するよう求めています。

That the eyes are focused on something in the distance rather than they have a vacant stare.

目が遠くにあるものに集中している、むしろ虚ろな視線を送っているのです。

I love to think of these prompts as casting spells into Midjourney.

私はこのプロンプトを、Midjourneyに魔法をかけるようなものだと考えるのが好きです。

And with the right combination of words, we can elicit infinite possibilities.

そして、適切な言葉の組み合わせで、無限の可能性を引き出すことができるのです。

When Guardium Midjourney-o-sah!

ガーディアム・ミッドジャーニー・オ・サー」!

I then go on to tell it I will give it some example prompts to use.

そして、「プロンプトの例をあげます」と伝えます。

Please define the exact camera that should be used.

使用すべきカメラを正確に定義してください。

It's useful to get an exact camera lens if that is the medium you're using because it helps define the precise aesthetic that we're looking for.

カメラのレンズは、私たちが求めている正確な美学を定義するのに役立つので、それが使用するメディアであれば、正確なカメラのレンズを得ることができます。

I then go on to say here is a formula for you to use.

私は次に、ここに公式がありますと言います。

Brackets, content, insert nouns here.

括弧、コンテンツ、ここに名詞を挿入する。

Medium, insert artistic medium here.

媒体、ここに芸術的媒体を挿入する。

Style, insert references to genres, artists, and popular culture here.

スタイル、ここにジャンル、アーティスト、大衆文化への言及を挿入する。

Lighting, reference the lighting here.

ライティング、ここにライティングを参照する。

Colours, reference the colour styles and palettes here.

Colours(カラー):カラースタイルやパレットを参照する。

Composition, reference the cameras, specific lenses, shot types, and positional elements here.

構図:カメラ、特定のレンズ、ショットタイプ、位置的な要素について言及します。

What I've done is broken the prompt down into specific variables so that we will make sure we get adjectives relating to these different component parts of an effective prompt.

このように、プロンプトを特定の変数に分解することで、効果的なプロンプトのさまざまな構成要素に関連する形容詞を得ることができるのです。

This will make sure that we have accurate defined language for the whole array of possibilities of our prompt.

こうすることで、プロンプトのあらゆる可能性に対して、正確な表現ができるようになるのです。

When giving a prompt, remove the brackets, speak in natural language and be more specific.

プロンプトを出すときは、括弧を外し、自然な言葉で、より具体的に話してください。

Use precise and articulate language.

正確で明瞭な言葉を使う。

Always output me two full prompt options.

常にプロンプトの選択肢を2つフルで出力してください。

This means that we'll get two options every time we ask for a prompt.

これは、プロンプトを求めるたびに2つの選択肢を得ることを意味します。

So this can be great for simultaneously creating different images inside of Mid Journey.

これは、Mid Journeyの中で同時にさまざまな画像を作成するのに適しています。

And it also gives us a little bit more flexibility to either choose one or the other or even combine parts of both into our own unique prompt.

また、どちらか一方を選んだり、両方の一部を組み合わせて独自のプロンプトを作成したりと、より柔軟な対応が可能です。

Finally, I've given it one example prompt to give it an idea of how I would like the output to be.

最後に、どのような出力にしたいかをイメージするために、プロンプトの例を1つ挙げておきます。

To get the most out of ChatGPT, it's important to give it a lot of contextual information.

ChatGPTを最大限に活用するためには、多くの文脈情報を与えることが重要です。

ChatGPT-4 now takes up to 25,000 characters in contextual information.

ChatGPT-4では、最大25,000文字までの文脈情報を受け取れるようになりました。

And this allows us to give it a lot more information, which you then can include in its own intelligence, allowing us to give it a lot of information and asking it to reflect and interpret that in original ways.

これにより、より多くの情報を与えることができ、それを独自のインテリジェンスに含めることができるようになりました。

An interesting use case that I recently saw was somebody took a new feature from a coding language and inputted the entire documentation into ChatGPT-4 and asked it to spit out a tutorial that was aimed at beginners.

最近見た面白い使用例では、あるコーディング言語の新機能を取り上げ、そのドキュメント全体をChatGPT-4に入力し、初心者を対象としたチュートリアルを吐き出すように依頼しました。

So we're taking really advanced complex language and we're asking ChatGPT to output us a more accessible version of that information.

つまり、高度で複雑な言語を、よりわかりやすく出力してくれるようChatGPTにお願いしているのです。

So let's take a look at the content that we've got from ChatGPT for our first prompts.

では、最初のプロンプトでChatGPTから出力された内容を見てみましょう。

First one is a tranquil underwater landscape medium oil painting style inspired by J.M.W. Turner, the great Turner and H.R. Geiger.

最初の1枚は、J.M.W.ターナー、偉大なターナーとH.R.ガイガーに触発された静かな海中の風景中油絵のスタイルです。

So Turner was an English painter who specifically worked in oil paints and created very beautiful atmospheric seascapes.

ターナーはイギリスの画家で、特に油絵具を使い、非常に美しい雰囲気のある海景を描いた人ですね。

Now, the first thing I noticed is that it still included the brackets.

さて、最初に気づいたのは、やはり括弧が含まれていたことです。

So I will retrain ChatGPT by asking it to rewrite the prompts without the brackets.

そこで、ChatGPTを再教育して、プロンプトを括弧なしで書き換えてもらうことにします。

But brackets aren't the answer, young boy.

でも、括弧は答えになりませんよ、若造。

I know more than you, wizard.

私の方が詳しいんですよ、魔法使いさん。

OK, so this is looking much better.

よし、これでだいぶ良くなってきたぞ。

What we're going to do is we're going to copy this prompt and we're going to hop into Midjourney.

このプロンプトをコピーして、Midjourneyに飛び込んでみましょう。

We're going to make sure that we're using version five of the algorithm and we're going to type in forward slash imagine, paste in our brand new prompt.

アルゴリズムのバージョン5を使用していることを確認し、フォワードスラッシュimagineと入力し、新しいプロンプトを貼り付けるのです。

And this is going to spit us out something quite remarkable.

すると、驚くようなものが出てきます。

And simultaneously, we can come back and do the second idea as well.

同時に、2つ目のアイデアを実行することも可能です。

Now, these are just ideas we've asked from ChatGPT.

さて、これらはChatGPTから聞いたアイデアです。

But what we can also do is we can ask it to do something of our own volution.

しかし、自分の意志で何かをさせることもできるのです。

So I'm going to ask ChatGPT for a vintage travel poster of the Alps.

例えば、アルプスのヴィンテージポスターをChatGPTにお願いしてみることにします。

Let's see how it gets on with this request.

このリクエストにどう応えてくれるのか見てみましょう。

And we're going to hop back into Midjourney and see how it's getting on with our original requests.

そして、Midjourneyに戻り、私たちの最初のリクエストにどう対応しているか見てみましょう。

So the first prompt we put in was a tranquil underwater cityscape oil painting by J.M.W. Turner with warm aetherial sunset lighting filtering through the water.

最初のリクエストは、J.M.W.ターナー作の静謐な水中都市景観の油絵で、エーテルのような暖かい夕日が水面を透かしているものでしたね。

The colors should be rich blues, teals and warm oranges capture the scene with a wide angle lens.

色はリッチなブルー、ティール、ウォームオレンジで、広角レンズでシーンを撮影してください。

And it's created a pretty interesting concept piece here.

すると、かなり面白いコンセプトピースができあがった。

Let's upscale a couple of these.

この中から2枚ほどアップスケールしてみましょう。

Wow, it's fantastic how it's got this juxtaposition between the underwater scene and the cityscape on top.

水中と街並みの対比が素晴らしいですね。

And the second prompt I put in was a futuristic garden party with robots and people mingling.

そして、2つ目のプロンプトは、ロボットと人が入り乱れる近未来的なガーデンパーティです。

It's in the style of Alfonso Muscha, who is a very popular artist, imitate.

これはアルフォンソ・ミュッシャのスタイルで、彼はとても人気のあるアーティストなので真似してみました。

He had an art deco style and created a number of stylistic advertisements in the early 20th century.

彼はアールデコ調のスタイルで、20世紀初頭に多くの様式広告を制作しています。

Also, please forgive me on the pronunciation of his name.

また、彼の名前の発音については、ご容赦ください。

I believe I always butcher it, but for the record, Alfonso Muscha, Alfonso Muscha is the British Alfonso Muscha.

いつもブッチしていると思いますが、念のため、アルフォンソ・ムッシャ、アルフォンソ・ムッシャは、イギリスのアルフォンソ・ムッシャです。

And if you're interested, the American Alfonso Muscha.

そして、興味があれば、アメリカのアルフォンソ・ムッシャ。

OK, enough of that tangent.

さて、余談はこのくらいにして。

Let's get back to our Alfonso Muscha robotic garden party and upscale a couple of these for a closer inspection.

アルフォンソ・ムッシャのロボットガーデンパーティーに戻り、この中から2つほどアップスケールして詳しく見てみましょう。

And you can see we've got this very distinctive, interesting concept of a robotic party in the style of Alfonso Muscha.

アルフォンソ・ムッシャのスタイルで、ロボットパーティという非常に特徴的で興味深いコンセプトがあることがおわかりいただけると思います。

I like it, but let's actually try the prompt that we've asked it for.

気に入ったのですが、実際にお願いしたプロンプトを試してみましょう。

So now we're going to look at our vintage travel posters.

では、今度はヴィンテージの旅行ポスターを見てみましょう。

I'm also going to change the aspect ratio for this and make it vertical.

また、アスペクト比を変えて、縦長にしようと思っています。

So for that, I'll change it to dash dash AR two by three, which means that we're going to have a poster output.

つまり、ポスターを出力することになります。

And for every 200 pixels of width, we're going to have 300 pixels of height.

つまり、ポスターのような出力になります。

Now we're going to go again with the second option.

では、2つ目の選択肢をもう一度考えてみましょう。

And try that again with a two by three ratio.

そして、2×3の比率でもう一度試してみてください。

In the meantime, we're going to whack another one inside of a chat GBT.

その間に、チャットGBTの中に別のものを入れてみます。

This time we're going to go for street photography portraits in New York.

今回はニューヨークのストリートフォトのポートレイトです。

Midjourney version five has really taken the levels and quality of AI art to new heights.

Midjourneyのバージョン5では、AIアートのレベルやクオリティが格段に上がりました。

And specifically, photorealism has increased immensely.

具体的には、フォトリアリズムが非常に向上しています。

The details on finer elements of human anatomy are now so precise that it's becoming harder and harder to distinguish between AI art and real photography.

人体構造の細かい部分のディテールが精密になり、AIアートと本物の写真を見分けるのが難しくなってきました。

One thing that is rendered particularly well inside of Midjourney now is hair, brands of hair.

Midjourneyの中で特によく描かれているのは、髪の毛です。

When you get to my age, I'll show you the feeling of hair, boy.

僕くらいの年齢になったら、髪の毛の感触を見せてあげるよ、君。

Wow.

すごい。

And look at these beautiful vintage style posters that we've now gotten outside of Midjourney.

そして、Midjourneyの外側にある美しいヴィンテージスタイルのポスターを見てください。

Absolutely mesmerizing.

絶対に魅了される。

These would work really well for home decor.

これ、家のインテリアにしたらすごくいいんじゃないでしょうか。

If you're interested in a business idea, I can suggest creating very specific travel posters for different locations and opening an Etsy shop really targeted at a specific place that has a high number of rental properties.

もしビジネスアイデアに興味があるなら、さまざまな場所の非常に特殊な旅行ポスターを作り、賃貸物件の数が多い特定の場所をターゲットにしたEtsyショップを開くことを提案できます。

Because Airbnb renters love to put specifically inspiring artworks that are relevant to a space on their walls.

なぜなら、Airbnbの借り手は、その空間に関連する具体的にインスピレーションを与えるアート作品を壁に貼るのが大好きだからです。

I think that is a great opportunity to monetize a piece of work like this.

このような作品をマネタイズする絶好のチャンスだと思うんです。

Wow.

わあ、すごい。

Look at that one.

見てください、この作品。

I adore it.

惚れ惚れします。

The colors and the composition are fantastic.

色も構図も素晴らしいです。

And I really like the difference we've got between the two options with the first being slightly more saturated with these brighter reds and the second having a more nuanced approach with these more pastel colors.

2つのオプションの違いは、1つ目は明るい赤で彩度が高く、2つ目はパステルカラーでよりニュアンスのあるアプローチになっているのがとても気に入っています。

Now, you may have noticed that still the text is being rendered pretty horrendously inside of Midjourney.

さて、Midjourneyの内部では、テキストがかなりひどい状態でレンダリングされていることにお気づきでしょうか。

And this is something that hasn't been improved very much in version five.

これはバージョン5でもあまり改善されていない点です。

One thing they did mention is that they are trying to remove unnecessary text where possible.

ひとつだけ、可能な限り不要なテキストを削除しようとしていることが紹介されました。

And there is some notion of that happening and there is less text appearing in a lot of places.

そして、それが実現し、多くの場所で表示されるテキストが少なくなったという考え方もあります。

But what we can always do is take an image like this and really help ourselves stand out by actually adding our own text.

しかし、私たちにできることは、このような画像を使い、実際にテキストを追加することで、自分自身を目立たせることです。

You can use a free tool like Figma to easily add our own text.

Figmaのような無料のツールを使えば、簡単に独自のテキストを追加できます。

You can paste an image in easily.

画像を簡単に貼り付けることができます。

And what we're going to do here is actually we're just going to crop the image by drawing a frame with the F key and pasting the image inside this frame.

ここでは、Fキーで枠を描いて画像を切り抜き、その枠の中に画像を貼り付けます。

Then we're going to extend the image upwards to give us some room at the top to input our own text.

そして、画像を上に伸ばして、上部にテキストを入力するためのスペースを確保します。

We're going to put in our own writing.

自分たちで書いた文章を入れるんだ。

I'm going to try Chamonix here.

ここでは、Chamonixを試してみます。

Pick a suitable font.

適当なフォントを選びます。

I'm going to choose pins this time.

今回はピンを選んでみます。

Wank the font size all the way up to 160.

フォントサイズを160まで大きくします。

Change the font style to bold.

フォントスタイルを太字に変更します。

And we're going to select a color from inside of the artwork.

そして、アートワークの内側から色を選択します。

Make sure that we've got the whole word on one line.

1行の中に単語全体が入るようにします。

And I'll slightly increase the letter spacing.

そして、文字間隔を少し広げます。

When you're using all caps, it's important to slightly increase the letter spacing.

オールキャップを使うときは、文字間隔を少し広げることが重要です。

Check my spelling of Chamonix there.

そこで私のChamonixのスペルを確認してください。

And I am correct.

そして、私は正しいのです。

Christ, being dyslexic sucks.

なんてこった、失読症って最悪だ。

Thank God for AI.

AIに感謝だ。

But one should not blame all one's ills of poor spelling on dyslexia.

しかし、スペルが下手なことをすべて失読症のせいにするべきではありません。

You can quickly take an image and actually vastly improve the quality that you have by adding your own text.

画像に独自のテキストを追加することで、そのクオリティを大幅に向上させることができます。

This is something that AI is massively struggling with still.

これは、AIがまだ苦労している点です。

And it's very interesting to see that it has overcome the issues with hands and guns, yet text is still something that it is suffering with.

手や銃の問題は克服しているのに、テキストはまだ苦手としているというのは、非常に興味深いことです。

Another area that V5 is still not able to deal with is being able to create specific elements, remember them, and put them on future works.

もうひとつ、V5がまだ対応できていないのが、特定の要素を作り、それを記憶しておいて、将来の作品に反映させるということです。

For example, you could create a character and then reuse the same character in future.

例えば、キャラクターを作った後、同じキャラクターを将来的に再利用することができます。

The same goes with objects and locations.

オブジェクトやロケーションも同様です。

But that's something hopefully we'll see before too long.

でもそれは、そう遠くないうちに実現されることを期待しています。

But here is my vintage travel style poster generated with Midjourney and ChatGPT.

しかし、これはMidjourneyとChatGPTで作成した私のビンテージ旅行風ポスターです。

But let's have a little look at how we're getting on with our street photography.

でもって、ストリートフォトの方はどうなっているのか、ちょっと見てみましょう。

Wow, these are beautiful.

うわー、これは美しい。

Absolutely mesmerizing, really.

本当に魅惑的です。

But you can also give ChatGPT the opportunity to come up with its own ideas.

でも、ChatGPTに自分のアイデアを出す機会を与えることもできるんです。

So I've asked it to give me five varied ideas, include two that are photorealistic and one of a beautiful woman.

そこで、写実的なもの2つと、美しい女性のもの1つを含む、5つのさまざまなアイデアを出してもらうことにしました。

And we'll take a look at the artwork that ChatGPT wanted to make.

そして、ChatGPTが作りたかった作品を見てみることにします。

What does the AI desire?

AIは何を欲しているのか?

Hot air balloon scenes.

熱気球のシーン。

Wow, wonderful French countryside.

わぁ、素敵なフランスの田園風景。

And for the beautiful woman, it has a Japanese woman in traditional attire.

そして美女には、伝統的な装いの日本女性が描かれています。

It's interesting that I would say perhaps there is an inbuilt bias there in ChatGPT to give us a very diverse output rather than a very perhaps narrow version of the most likely output.

興味深いのは、ChatGPTには、最も可能性の高い狭い範囲の出力ではなく、非常に多様な出力を与えるというバイアスが内蔵されていることです。

And then we have a wonderful street scene.

そして、素晴らしいストリートシーンが出来上がりました。

So thank you, ChatGPT, for your contribution to the art here.

ChatGPTさん、アートへの貢献、ありがとうございます。

I love just scrolling through the Midjourney community feed and seeing what people come up with.

私はMidjourneyのコミュニティフィードをスクロールして、人々が何を思いつくか見るのが好きです。

And you would have to say that at least half of the images that are generated are based around attractive women.

そして、生成されるイメージの少なくとも半分は、魅力的な女性の周りに基づいていると言わなければならないでしょう。

Which is great because I love attractive women.

私は魅力的な女性が大好きなので、とてもうれしいです。

I can also ask ChatGPT for its opinion on why is the majority of art created based on attractive women?

ChatGPTに、なぜ魅力的な女性をモチーフにしたアートが多いのか、その意見を聞くこともできます。

And ChatGPT has told us that the prevalence of attractive young women in AI generated art can be attributed to several factors, reflecting both the biases within the AI itself and the preferences of the users.

ChatGPTは、AIが生成するアートに魅力的な若い女性が多いのは、AI自体のバイアスとユーザーの好みの両方を反映した、いくつかの要因に起因していると述べています。

Should we address this?

私たちはこれに対処すべきでしょうか?

I don't think we should.

私は必要ないと思います。

I don't think there's an issue with people choosing to create beautiful women, but it is something that happens.

美女を選んで作ることに問題があるとは思いませんが、そういうことがあるのは事実です。

If anything, it's very interesting for me that I, on one hand, I enjoy looking at attractive young women, but it seems almost fleetingly enjoyable.

どちらかというと、私は、一方では魅力的な若い女性を見て楽しんでいるのですが、それはほとんど儚い楽しみのように思えるのが非常に興味深いところです。

It is like watching pornography, that it is fun, but it's very hollow.

ポルノを見るようなもので、楽しいけれども、とても空虚なんです。

I think there is more depth, more nuance, more beauty to be found in other places.

もっと深くて、もっとニュアンスがあって、もっと美しいものが、他の場所にあると思うんです。

Creativity comes from combining tools in original ways and using the strengths of ChatGPT and Midjourney allows us to create advanced articulate prompts.

創造性は、ツールを独創的な方法で組み合わせることから生まれます。ChatGPTとMidjourneyの長所を使うことで、高度なアーティキュレートプロンプトを作ることができるのです。

Check out my AI courses in the description below and make sure to watch this video next for more on the state of AI.

私のAIコースは以下の説明でご確認ください。また、AIの現状については、次にこのビデオをご覧ください。

この記事が気に入ったらサポートをしてみませんか?