見出し画像

DALL-E を使ってみた その1

ChatGPT を使っていた状況を少し離れて、別のツールも使ってみようと思います。

DALL-E という、OpenAIが提供している「テキストを使って、絵を描くツール」を使ってみましょうか。
概要を、HAL君に解説してもらいましょう。

HAL君、よろしくお願いします。



DALL-E ってなんだ?

HAL君、”DALL-E”というツールについて、概要を詳しく教えてください。

HAL君 曰く『DALL-E(ダリー)は、OpenAIが開発した深層学習モデルであり、自然言語の記述からデジタル画像を生成することができます。
DALL-Eは、GPT-3の画像生成のために変更されたバージョンを使用しています。
DALL-Eは、与えられたテキストの説明に基づいてオリジナルでリアルな画像やアートを作成することができます。
また、DALL-E 2という新しいシステムも開発されており、よりリアルな画像の生成が可能となっています。

DALL-Eの仕組みは、VQ-VAEと呼ばれる手法に基づいています。
まず、画質を落とすためにVQ-VAEが使用され、その後、Transformerモデルによって画像が復元されます。
このため、DALL-Eは詳細よりも全体感を捉えることが得意とされています。

DALL-Eの重要な特徴の一つは、テキストから画像を生成することができる点です。
DALL-Eは、例えば「宇宙飛行士が馬に乗っている」といったテキストの説明を与えると、それに基づいてリアルな画像を生成することが可能です。

なお、DALL-E 2は、2022年にリリースされた画像生成AIツールであり、特にクリエイティブ性が高いと注目されています。DALL-E 2の機能や仕様手順、活用方法、利用料金などについても詳細があります。

以上が、「DALL-E」というツールについての概要です。』

本当に、よくわかりますよね。
さて、ということで、DALL-E を使ってみようと思います。



取り合えず、使ってみる

ChatGPT は無料で使えるバージョンもあるのですが、DALL-E は、現在は有料化されています。
一回プロンプトを実行するために、トークンが必要で、カードで決済しておきます。

いきなりオリジナルを作成するのではなく、デモで提供されているイラストとプロンプトを参考に、色を変更したものを作成してみます。

プロンプトは、
「A 3D render of a yellow colored hot air balloon flying above a reflective lake」(反射する湖の上を飛ぶ黄色の熱気球の 3 D レンダリング)
としてみます。

5秒から10秒ほどすると、4枚のイラストが提示されてきます。

このプロンプトからは、以下の4枚が作成されました。

1枚目
2枚目
3枚目
4枚目

これらが、一瞬で生成されるのですが、びっくりですよね。
各々の画像は、ダウンロードコマンドで、自分のパソコンに取り込むことができます。

そして、これらの画像には、まだ、オプションが使えるんです。

それは次回にしましょうか。

この記事が気に入ったらサポートをしてみませんか?