ぎわ

ぎわぎわぎわわわ

ぎわ

ぎわぎわぎわわわ

記事一覧

蒸留による高速化は、多様性を減らしているのではないか?

LCM をベースにした LCM-LoRA が高速化の可能性を広げ盛り上がった。 そしてそれらのアイデアをもとにTCDがリリースされ、TCDをベースにさらに発展させたHyper-SDが出てき…

ぎわ
2日前

【論文解説】LCM-LoRA: 高速で高品質な画像生成を可能にする汎用的な潜在一貫性モデル

はじめにLatent Diffusion Models (LDMs) は高品質な画像生成を可能にしますが、生成プロセスに多くの時間を要するという問題があります。 この問題に対して、Latent Cons…

ぎわ
4日前
1

FIDとHPSの違いについて

テキストから画像を生成するモデルが注目を集めています。しかし、生成された画像の品質を評価するのは簡単ではありません。そこで重要な役割を果たすのが、FID (Fréchet …

ぎわ
9日前
1

RunPod の Serverless で Stable Diffusion で画像生成

GPU SOROBAN や Google Compute Engine の GPU インスタンスをいままで利用していましたが、推論(生成)に使わないときの金額がもったいないので RunPod の Serverless を試…

ぎわ
1か月前
1

Scalable High-Resolution Pixel-Space Image Synthesis with Hourglass Diffusion Transformers の雑な理解

https://crowsonkb.github.io/hourglass-diffusion-transformers/ を読みました 一言でいうと「Stable Diffusionが潜在空間でやっていた学習を、ピクセル単位で短時間かつ…

ぎわ
2か月前
1

技術者界隈を盛り上げる会の感想

2020/07/04更新 https://twitter.com/oukayuka/status/1277942032724443137?s=21 床に広げるのはおもしろい。面積が広いので合理的。デスクのような狭いところだと発想を…

ぎわ
3年前

『あなたの会社が90日で儲かる!』という胡散臭い本は、いまでも応用できそう

(2020/07/02更新) マーケティングの勉強をほそぼそと続けている。マーケティングの定義は正直まだわからないが商品を売る活動全般のことを指していると現状では思ってい…

ぎわ
3年前
3

コーチングを学ぶ読書メモ

(2020/07/04更新) この記事は、次のように感じている人向けに書かれています。 「コーチングって言葉をよく聞くようになったけど一体なんだろう?」 「コーチングを覚え…

ぎわ
3年前
9

蒸留による高速化は、多様性を減らしているのではないか?

LCM をベースにした LCM-LoRA が高速化の可能性を広げ盛り上がった。

そしてそれらのアイデアをもとにTCDがリリースされ、TCDをベースにさらに発展させたHyper-SDが出てきた。

Hyper-SD の画像レベルは高いが、一方で多様性が減っているのではないかという直感がある。

【論文解説】LCM-LoRA: 高速で高品質な画像生成を可能にする汎用的な潜在一貫性モデル

【論文解説】LCM-LoRA: 高速で高品質な画像生成を可能にする汎用的な潜在一貫性モデル

はじめにLatent Diffusion Models (LDMs) は高品質な画像生成を可能にしますが、生成プロセスに多くの時間を要するという問題があります。

この問題に対して、Latent Consistency Models (LCMs) が提案され、事前学習済みの LDMs から蒸留されたモデルを用いて、少ないステップ数で高品質な画像生成を実現しています。

今回は、LCMs をさらに発

もっとみる
FIDとHPSの違いについて

FIDとHPSの違いについて

テキストから画像を生成するモデルが注目を集めています。しかし、生成された画像の品質を評価するのは簡単ではありません。そこで重要な役割を果たすのが、FID (Fréchet Inception Distance) とHPS (Human Preference Score) という2つの評価指標です。

今回は、この2つの指標の違いについて解説していきます。

FIDとは?FIDは、生成された画像と本

もっとみる

RunPod の Serverless で Stable Diffusion で画像生成

GPU SOROBAN や Google Compute Engine の GPU インスタンスをいままで利用していましたが、推論(生成)に使わないときの金額がもったいないので RunPod の Serverless を試しました。

RunPod ではあらかじめ Automatic1111 さんの Stable Diffusion Web UI を GUI なしの API モードを Server

もっとみる
Scalable High-Resolution Pixel-Space Image Synthesis with Hourglass Diffusion Transformers の雑な理解

Scalable High-Resolution Pixel-Space Image Synthesis with Hourglass Diffusion Transformers の雑な理解

https://crowsonkb.github.io/hourglass-diffusion-transformers/ を読みました

一言でいうと「Stable Diffusionが潜在空間でやっていた学習を、ピクセル単位で短時間かつ詳細かつ少ないパラメーターで正確に学習できる仕組み」を作ったということですね。 これによる恩恵は、短時間で高精細な画像が得られるし、潜在特有のぶっ飛んだ画像も作

もっとみる

技術者界隈を盛り上げる会の感想

2020/07/04更新

https://twitter.com/oukayuka/status/1277942032724443137?s=21
床に広げるのはおもしろい。面積が広いので合理的。デスクのような狭いところだと発想を狭める。

書いたときは3週間。準備に1週間、執筆2週間。後で見てみて、技術的に間違ったことを書いていたことに気づいた。

Word→一太郎→vscodeのmarkdo

もっとみる

『あなたの会社が90日で儲かる!』という胡散臭い本は、いまでも応用できそう

(2020/07/02更新)

マーケティングの勉強をほそぼそと続けている。マーケティングの定義は正直まだわからないが商品を売る活動全般のことを指していると現状では思っている。

マーケティングを学ぶきっかけとなったのは、とある情報商材で15万円くらいを投資して購入したものだった。当時「自分の情報をお金にしたい」「自分の力でものを売ってみたい」と強い思いを持っていた僕は、ものの見事に商材を買ってし

もっとみる
コーチングを学ぶ読書メモ

コーチングを学ぶ読書メモ

(2020/07/04更新)

この記事は、次のように感じている人向けに書かれています。
「コーチングって言葉をよく聞くようになったけど一体なんだろう?」
「コーチングを覚えると、部下のメンタリングが楽になるらしいけど本当かな?」

読書する前のイメージ・コーチングは、相手の考えを引き出して行動へつなげること
・「人に伝えるためにしゃべることで思考が整理され、自己解決する」ラバーダッキングと似たよ

もっとみる