七師

小説やイラストを書いています。https://note.mu/tomo161382/n…

七師

小説やイラストを書いています。https://note.mu/tomo161382/n/n72979b5748bc

マガジン

  • StableDiffusion関連記事

    これまでに書いたStable Diffusionを使った画像生成に関する記事をまとめます。

  • Chat AIとLLM(大規模言語モデル)

    Chat AIとLLM(大規模言語モデル)に関して書いた記事をまとめます。

  • 七師のtwitterのまとめ

    私がtwitterに投稿した内容から選抜してまとめて行きます。 投稿内容に対するライセンスは、私の小説に対するライセンスに準じ、一定の条件の下、改変再配布自由とします。 詳細は以下のURLから確認してください。 http://tomo161382.blogspot.jp/2015/02/blog-post_19.html

記事一覧

固定された記事

Layered Diffusion Pipeline の使い方

この記事は、GitHubに置かれているLayered Diffusion Pipelineのトップページの翻訳です。なお、この説明はライブラリの基本的な使い方のみをカバーしていて、発展的な使い…

七師
1年前
5

各種英語検定スコアの換算表(英検、TOEIC、TOEFL、IELTS、etc)

換算表各種英語検定スコアの換算表を作成しました。 表に含まれる英語検定は次の通りです。 CEFR 英検 TOEIC L&R IELTS TOEFL iBT TOEFL Junior iTEP SLATE-Plus …

七師
15時間前
1

e-taxソフト(ダウンロード版)でスマホをICリーダーとして使う方法(備忘録)

目的と背景e-taxソフトのWeb版やSP版、受付システムでは、QRコード認証を使ってマイナポータルアプリ経由でマイナンバーカードのICチップを読み取ることができます。 しか…

七師
2か月前
1

CLIP Text Deprojectorを使って画像生成してみる ~モデルの大幅な簡略化~

前回まで、LSTMベースのモデルのアーキテクチャを検討し、最後に訓練データの変更を試しました。今回は、そこで得た知見から、さらにモデルアーキテクチャを簡略化してみま…

七師
3か月前
5

CLIP Text Deprojectorを使って画像生成してみる ~最終正規化層を固定しない~

前回は、2つのモデルを繋ぎ合わせて画像生成してみました。本記事では視点を変え、最終正規化層の固定を解除して学習してみました。 前回の記事 他のStable Diffusionの…

七師
3か月前
4

CLIP Text Deprojectorを使って画像生成してみる ~EOS前とEOS後の組み合わせ~

前回は、訓練データの一部を学習に使わない方法を試しましたが、今回は後から生成した状態を繋ぎ合わせる実験を試みます。 前回の記事 他のStable Diffusionの関連記事 …

七師
3か月前
2

CLIP Text Deprojectorを使って画像生成してみる ~訓練データの一部を無視~

前回は、それまでに作ったLSTMモデルのバリエーションの性能比較をしましたが、今回は、訓練データの与え方についての実験を行います。 前回の記事 他のStable Diffusion…

七師
3か月前
4

Stable DiffusionでText Encoderの出力を短く切ってみる(補足)

先日、Stable DiffusionでText Encoderの出力を短く切って画像生成する実験をしましたが、その中に、設定を微調整してやり直す方がよいものがあったため、再実験した結果を…

七師
3か月前

CLIP Text Deprojectorを使って画像生成してみる ~LSTMモデルの比較~

ここで、一度、これまでに作ったLSTMモデルのバリエーションの性能比較を行ってみようと思います。 前回の記事 他のStable Diffusionの関連記事 Layered Diffusion Pipe…

七師
3か月前
2

CLIP Text Deprojectorを使って画像生成してみる ~MLPを適用してみる~

前回まで、内部次元数とレイヤー数を変化させてきましたが、今回は、MLPレイヤーを追加して比較してみます。 前回の記事 他のStable Diffusionの関連記事 Layered Diffu…

七師
3か月前
1

Stable DiffusionでText Encoderの出力を短く切ってみる

先日、Text Encoderの出力の順序を変える実験を行って、順序がStable Diffusionの生成画像に影響を与えないことを確認しました。 その後、さらにコードを読み込んで、Text…

七師
3か月前
5

CLIP Text Deprojectorを使って画像生成してみる ~レイヤー数を増やす~

前回まで、LSTMの内部次元数を増やす実験をしてきましたが、今回は内部次元数を一定にして、LSTMを含むネットワークを多層化して比較します。 前回の記事 他のStable Dif…

七師
3か月前
1

Stable DiffusionでText Encoderの出力の順序を変えてみる

Diffusers版のStable Diffusion (v1.5)のコードを読んでいて、ふと、次のことに気が付きました。 SD v1.5では、Text Encoderの出力は最終隠れ状態全体をそのまま加工せず…

七師
4か月前
2

CLIP Text Deprojectorを使って画像生成してみる ~LSTMの入力形式の変更~

前回は、LSTMの内部次元数を変えましたが、今回は、前々回に触れたLSTMの入力形式の変更について実験しました。 前回の記事 他のStable Diffusionの関連記事 Layered Di…

七師
4か月前
1

CLIP Text Deprojectorを使って画像生成してみる ~LSTMの次元数を増やす~

前回、LSTMの次元数を増やす準備をしたので、今回は実際に次元数を増やして実験します。 前回の記事 他のStable Diffusionの関連記事 Layered Diffusion Pipelineを使う…

七師
4か月前
3

[年賀状に使える] StableDiffusionで飾り文字を作る

年賀状作成の時期はやや既に逸してしまったような気がしますが、以前、twitterに投稿した飾り文字の作り方を記事に起こしていなかったのを思い出したので、この機会に説明…

七師
4か月前
19
Layered Diffusion Pipeline の使い方

Layered Diffusion Pipeline の使い方

この記事は、GitHubに置かれているLayered Diffusion Pipelineのトップページの翻訳です。なお、この説明はライブラリの基本的な使い方のみをカバーしていて、発展的な使い方は記述されていないことを留意してください。

これは、Stable Diffusionパイプラインをより柔軟に使用するためのラッパーライブラリです。このパイプラインの主要な考え方は、Layerと呼ばれる概念

もっとみる
各種英語検定スコアの換算表(英検、TOEIC、TOEFL、IELTS、etc)

各種英語検定スコアの換算表(英検、TOEIC、TOEFL、IELTS、etc)

換算表各種英語検定スコアの換算表を作成しました。

表に含まれる英語検定は次の通りです。

CEFR

英検

TOEIC L&R

IELTS

TOEFL iBT

TOEFL Junior

iTEP SLATE-Plus

目的とある理由から、様々な英語検定のスコアを比較したいと思ったのですが、知りたい検定が一覧でまとまったものがなかったり、スコアの対応に疑問があったりして、不満があったた

もっとみる
e-taxソフト(ダウンロード版)でスマホをICリーダーとして使う方法(備忘録)

e-taxソフト(ダウンロード版)でスマホをICリーダーとして使う方法(備忘録)

目的と背景e-taxソフトのWeb版やSP版、受付システムでは、QRコード認証を使ってマイナポータルアプリ経由でマイナンバーカードのICチップを読み取ることができます。

しかし、e-taxソフト(ダウンロード版)の場合は、マイナポータルアプリが使用できず、ICリーダーを使ってマイナンバーカードを読み取る必要があります。

この記事は、その場合でも、スマホをICリーダーとして利用することで、専用の

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~モデルの大幅な簡略化~

CLIP Text Deprojectorを使って画像生成してみる ~モデルの大幅な簡略化~

前回まで、LSTMベースのモデルのアーキテクチャを検討し、最後に訓練データの変更を試しました。今回は、そこで得た知見から、さらにモデルアーキテクチャを簡略化してみます。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~最終正規化層を固定しない~

CLIP Text Deprojectorを使って画像生成してみる ~最終正規化層を固定しない~

前回は、2つのモデルを繋ぎ合わせて画像生成してみました。本記事では視点を変え、最終正規化層の固定を解除して学習してみました。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

最終正規化層の固定

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~EOS前とEOS後の組み合わせ~

CLIP Text Deprojectorを使って画像生成してみる ~EOS前とEOS後の組み合わせ~

前回は、訓練データの一部を学習に使わない方法を試しましたが、今回は後から生成した状態を繋ぎ合わせる実験を試みます。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

動機と手法前回の記事で試した

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~訓練データの一部を無視~

CLIP Text Deprojectorを使って画像生成してみる ~訓練データの一部を無視~

前回は、それまでに作ったLSTMモデルのバリエーションの性能比較をしましたが、今回は、訓練データの与え方についての実験を行います。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

動機訓練デー

もっとみる
Stable DiffusionでText Encoderの出力を短く切ってみる(補足)

Stable DiffusionでText Encoderの出力を短く切ってみる(補足)

先日、Stable DiffusionでText Encoderの出力を短く切って画像生成する実験をしましたが、その中に、設定を微調整してやり直す方がよいものがあったため、再実験した結果を補足します。

先日の記事はこちら。

他のStable Diffusionの関連記事

前回の実験の問題点と修正方法前回の実験で「マスクをなしで、後ろから50トークン目以降を使用」という方法で画像生成したところ

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~LSTMモデルの比較~

CLIP Text Deprojectorを使って画像生成してみる ~LSTMモデルの比較~

ここで、一度、これまでに作ったLSTMモデルのバリエーションの性能比較を行ってみようと思います。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

方針モデルを比較するにあたって、モデルのサイズ

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~MLPを適用してみる~

CLIP Text Deprojectorを使って画像生成してみる ~MLPを適用してみる~

前回まで、内部次元数とレイヤー数を変化させてきましたが、今回は、MLPレイヤーを追加して比較してみます。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

モデルアーキテクチャLSTMモデルを、

もっとみる
Stable DiffusionでText Encoderの出力を短く切ってみる

Stable DiffusionでText Encoderの出力を短く切ってみる

先日、Text Encoderの出力の順序を変える実験を行って、順序がStable Diffusionの生成画像に影響を与えないことを確認しました。

その後、さらにコードを読み込んで、Text Encoderの出力の長さが変わっても、画像生成モデル自体は正常に動作するはずだと気づきました。

また、少なくともdiffusersのUNetの実装には、Text Encoderの出力にマスクを付けて渡

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~レイヤー数を増やす~

CLIP Text Deprojectorを使って画像生成してみる ~レイヤー数を増やす~

前回まで、LSTMの内部次元数を増やす実験をしてきましたが、今回は内部次元数を一定にして、LSTMを含むネットワークを多層化して比較します。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

もっとみる
Stable DiffusionでText Encoderの出力の順序を変えてみる

Stable DiffusionでText Encoderの出力の順序を変えてみる

Diffusers版のStable Diffusion (v1.5)のコードを読んでいて、ふと、次のことに気が付きました。

SD v1.5では、Text Encoderの出力は最終隠れ状態全体をそのまま加工せずにUNetの各ブロックのCross Attentionに入力されています。その際、マスクも位置エンコーディングなども付加されている様子がないため、Attentionの性質からおそらく順不同

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~LSTMの入力形式の変更~

CLIP Text Deprojectorを使って画像生成してみる ~LSTMの入力形式の変更~

前回は、LSTMの内部次元数を変えましたが、今回は、前々回に触れたLSTMの入力形式の変更について実験しました。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

モデルアーキテクチャ今回試すモ

もっとみる
CLIP Text Deprojectorを使って画像生成してみる ~LSTMの次元数を増やす~

CLIP Text Deprojectorを使って画像生成してみる ~LSTMの次元数を増やす~

前回、LSTMの次元数を増やす準備をしたので、今回は実際に次元数を増やして実験します。

前回の記事

他のStable Diffusionの関連記事

Layered Diffusion Pipelineを使うためのリンク集

ライブラリの入手先と使用法(英語) : Githubリポジトリ

日本語での使用方法の解説 : Noteの記事

実験の設定今回実験に使うモデルは、前回の記事の後半で実験

もっとみる
[年賀状に使える] StableDiffusionで飾り文字を作る

[年賀状に使える] StableDiffusionで飾り文字を作る

年賀状作成の時期はやや既に逸してしまったような気がしますが、以前、twitterに投稿した飾り文字の作り方を記事に起こしていなかったのを思い出したので、この機会に説明しておこうと思いました。

今回紹介するのは、上のような個性的な飾り文字の作り方です。

文字の下書きの作成まずは、文字の下書きを作ります。適当なペイントソフトを立ち上げて、ロゴの文字を配置した白黒画像を作ります。ここでは、mspai

もっとみる