見出し画像

Google Colab で はじめる ERNIE-ViLG

「ERNIE-ViLG」が二次元キャラの画像生成が得意らしいということで試してみました。

・PaddlePaddle v2.3.2
・PaddleHub v2.3.0

1. ERNIE-ViLG

「ERNIE-ViLG」は、中国の大手インターネットおよび AIサービス企業のBaiduが開発した、テキストから画像を生成する画像生成AIです。Baiduが開発した深層学習フレームワーク「PaddlePaddle」とモデルハブ「PaddleHub」経由で利用できます。

2. Colabでの実行

Colabでの実行手順は、次のとおりです。GPUなくても動きます。

(1) パッケージのインストール。

!pip install paddlepaddle paddlehub
import paddlehub as hub
module = hub.Module(name="ernie_vilg")

(2) テキストから画像の生成。
今回は、猫耳メイド(貓耳女僕)で画像生成してみました。

module.generate_image(
    text_prompts=["貓耳女僕"], 
    style="卡通", 
    output_dir='./ernie_vilg_out/')

パラメータは、次のとおりです。

・text_prompts : 生成する画像の内容を説明するテキスト (中国語)。
・style : 生成する画像のスタイル。
 ・油画 (Oil painting) 
 ・水彩 (Watercolor)
 ・粉笔画 (Chalk drawing)
 ・卡通 (Cartoon)
 ・儿童画 (Children's drawing)
 ・蜡笔画 (Crayon drawing)
 ・探索无限 (Explore infinity)
・topk : 保存する画像の最大数 (デフォルト:6)。
・output_dir : 出力フォルダ (デフォルト:ernievilg_output)
・戻り値 : 生成されたPIL形式の画像のリスト。

指定したフォルダ(今回はernie_vilg_out)に画像が出力されています。

3. 関連



この記事が気に入ったらサポートをしてみませんか?