マガジンのカバー画像

技術畑でつかまえて

5
徒然なるままに技術関連の投稿をします
運営しているクリエイター

#AI画像生成

それなりにいい感じの画像がでるtxt2imgのpipelineを整えたのでまとめておく

お気持ち最近、個人的に画像生成AI(diffusionベース)を用いて画像生成をしている。 はじめの頃はwebuiを用いて一つ一つimg2imgなり、inpaintingなりを繰り返して頑張っていたのだが、画像生成技術の優位性はなんと言ってもその試行回数であると思っている。 故に、なるべくautoで好みの画像が生成されてくれれば好ましい。しかしながら闇雲に生成しつづけるだけでは大量に生成された画像に良質な画像が埋もれ、結局好みの画像に出会えない、という悲しい現象に遭遇してし

【論文メモ】Transformerを用いた高速なtxt2img

Muse: Text-To-Image Generation via Masked Generative Transformers論文リンク: https://arxiv.org/abs/2301.00704 公開日時: Submitted on 2 Jan 2023 概要離散トークンを使用し、サンプリングの反復回数が少ないため拡散モデルより効率的。 並列デコードを使用するため自己回帰モデルより効率的。 900MパラメータモデルにおいてCC3MでFID score: 6