data:image/s3,"s3://crabby-images/88887/88887fdb0c812d2f0ba45b34eab5b07b722dcbab" alt="見出し画像"
Google Colab ではじめる Instruct-Pix2Pix
Google Colab で「Instruct-Pix2Pix」を試したのでまとめました。
・diffusers v0.12.0
1. Instruct-Pix2Pix
「Instruct-Pix2Pix」は、人間の指示で画像編集するためにファインチューニングされた「Stable Diffusion」モデルです。 入力画像と、モデルに何をすべきかを与えると、モデルがそれに従って画像編集を行います。
画像に対して、次のような指示を与えることができます。
・swap sunflowers with roses (ひまわりをバラと交換)
・add fireworks to the sky (空に花火を追加)
・replace the fruits with cake (果物をケーキに置き換える)
data:image/s3,"s3://crabby-images/3a4cc/3a4ccf274de4789f15b90cefd3090a0aa494ca6b" alt=""
2. Colabでの実行
Google Colabでの実行手順は、次のとおりです。
(1) 新規のColabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」を選択
(2) パッケージのインストール。
# パッケージのインストール
!pip install diffusers transformers safetensors accelerate
(3) パイプラインの準備。
StableDiffusionInstructPix2PixPipelineクラスを使い、モデルIDに"timbrooks/instruct-pix2pix"を指定します。
import torch
from diffusers import StableDiffusionInstructPix2PixPipeline
# パイプラインの準備
pipe = StableDiffusionInstructPix2PixPipeline.from_pretrained(
"timbrooks/instruct-pix2pix",
torch_dtype=torch.float16
).to("cuda")
(4) 画像のアップロード。
左端のフォルダアイコンでファイル一覧を表示し、画像 (cat.png) をドラッグ&ドロップします。
data:image/s3,"s3://crabby-images/65e1a/65e1a880a67ef20d558f835cf9fbc781167c8500" alt=""
・cat.png
data:image/s3,"s3://crabby-images/e54b0/e54b0f45e325044862fa083c8fe3e515ccf1f007" alt=""
(5) 画像の読み込み。
cat.pngを読み込み、512x512のRGB画像に補正しています。
from PIL import Image
# 画像の読み込み
image = Image.open("cat.png").resize((512, 512)).convert("RGB")
image
(6) 画像編集。
今回の指示は、"replace the cat with teddy bear" (猫をクマのぬいぐるみに置き換え)としました。
# 画像編集
prompt = "replace the cat with teddy bear"
edit_image = pipe(prompt,
image=image,
num_inference_steps=20,
image_guidance_scale=1.5,
guidance_scale=7).images[0]
edit_image
data:image/s3,"s3://crabby-images/77d3b/77d3bc463e631a930eb0755f315ab63c63c4a1a7" alt=""
"shiba inu" や "tiger" にすると、次のようになりました。
data:image/s3,"s3://crabby-images/b38fd/b38fd3edb42dddf57243c2700e77bd49a1a82fa8" alt=""
data:image/s3,"s3://crabby-images/84ab7/84ab77f95d4a9adaa3fa366ba296136ecc71e2a8" alt=""