見出し画像

Stable Diffusion、オープンソース、確実性、手順のわかりにくさ

(約 2,900文字の記事です。)

さて、Stable Diffusionを実際に使ってみよう!誰かの記事を読んで、その手順通りにやってみて、すんなりとPCへのローカル環境構築ができた人はブラウザバック。



Stable Diffusionのローカル環境構築が絶望的に難しい理由

私は、丸々2日間を無駄にしてローカルPCへのStable Diffusionを体験できなかった側の人間です。人間不信になった記事です。妥協して3日目にしてようやく非ローカルPCも含めてStable Diffusionを体験できた。

Google検索して情報収集して、いざエンジニアを名乗る人の、不特定多数の謎の記事やブログが、必ずしもPython初心者にとって「分かりやすい記事」でもなく「正確な情報とは限らない」そんな人生経験を得た。


だがしかし、その反動を糧として、近日中にStable DiffusionのWindowsユーザー向けの使い方記事を執筆予定。


まともな情報がない

Stable Diffusionを体験したい多くのユーザーがWindowsユーザーということと、文字列から画像を生成する「text to image(text2img)」と、逆に自分で描いたラフな下絵から詳細な絵を描かせる「image to image (img2img)」の2つを自分の手で色々試したいはずだ。

ところがそれを「サクッと、簡単に、確実に」成し遂げるためのマニュアルが、驚くほどに見つからない。

断片的な記事は散見される。よさげだと思った記事を上から順に実施すると肝心なところで「あとは自分でなんとかして(完)」だったり「突然個人の感想で記事が完結」という記事が多くて困った。

辟易した。あぁ、これが一般人の情報発信なのか、と。


そういう人が書いた記事では、ガイドする内容について最後まで面倒を見てくれない。


あぁ、これがSNS時代の情報発信なのか、と。


がっかりした。そしてイライラした。


なぜならば、私はそんな情報発信をほとんどしていない。書ける分にはしっかりと最後までガイドするし、自分がハマった罠についても詳細に書いているし、そもそもその罠の回避策を最初に持ってくる。そういう工夫を凝らした上での、素人では難しいライティング技術を駆使してこれまで記事を執筆しつつ、今に至る。だからこそ、立場が逆転したときのフラストレーションは半端ない😭

ただ書けばいいってもんじゃないし、主観と客観の切り分けや、本音の吐露やTipsやコーヒーブレークという休憩のはさみ方、そういう技術を持っている。

今回、私が100%素人の状態からStable Diffusionを試そうと思って試し、結果、色々と学びを得た。フレッシュな感想であると同時に、なんでこんなに分かりにくく書く人が多いの?という怒りと不満のぶちまけをnoteに勢いで書いた。noteはクリエーターの自由な公園だと思っているので、そういう内側の心理も包み隠さず吐露しておく。
なお他者への攻撃の意図はない。あくまでも自分のための公開日記😊


情報の価値(それは誰にとって有益なのか?)

今回の無駄な、不毛な試行錯誤で、色んな学びがあった。でも、どちらかというと、絶望を感じた。先達に対してはもう少ししっかりとした、面倒見の良い記事の情報発信をして欲しい。そう思った。

とはいえ個人が無料で発信する情報に責任など皆無だ。

でも、それでも、Stable Diffusionというエポックメイキングな内容についての、最先端の記事を書けるタイミングで記事を執筆できるプロのエンジニアの方々や、それなりの有識者や経験者が情報発信をしてくれるならば、もう少し「初心者にとって分かりやすく、配慮した情報発信」をして欲しいと願う。

結果としては、分かりにくい記事は割と「自称、自分のメモ書きだよ」という言い訳付きの記事が多く、読んでみたところで「サッパリ分からない」という、がっかりする記事が多かった。私が「過去に受けた指摘」を流用するならば「それはチラシの裏にでも書いとけ」というレベルだと思う。


もちろん解釈しきれなかった自分の知識不足は否定しない。だが、有識者が初心者をガイドしないような内容の情報ならば、初心者にとっては「その情報、要らない」となってしまうのだ。=チラ裏に書け、と。
残念だが、これは間違いない。書くならばもう少し分かりやすく、あと100文字くらい足して丁寧なガイドを、と思う。


だからこそ、自分が発信する情報には、ある程度の「上から下まで手順通りすれば結果が得られる」という、初心者にとってのユーザーの満足感、これを大切にしてきた。(例外としては、「玄人向けだよ、初心者向けじゃないよ」という断り書きをしっかり入れてきた。)


オープンソースの闇

Stable Diffusionはオープンソースだ。そして3DCGにおいてはBlenderもオープンソースだ。そして両者に共通する「メリット、デメリット」これがめちゃくちゃよく分かった。

オープンソースにはメリットがある。まずは「無料」これだ。これについては誰も否定しないだろう。


ところが今回目に付いたのはデメリットのほうだ。

端的に言うと「情報の信頼性」これに尽きる。無料だから「自己責任の名の下に、誰も何も保証しない」。これのデメリットは、実は意外と闇が深い。

要するに「○○を確実に××するための手法や手順」について、誰も何も保証してくれない。これがオープンソースのデメリットだ。そうそう簡単には商用利用されない最大の理由とも言える。(もちろん「保証体制」による仕組みによっては商用利用に組み込まれる例もあるがそういう希有な例は除外。)

(例)150円を自販機に入れてボタンを押した時に、望みのオレンジジュースが「出るかも知れないし、出ないかも知れない。出るとしてもリンゴジュースだったりグレープジュースかも知れない」そんな自販機に150円を入れるか?という事だ。
150円ならいいが、150円だったら、どうか?

これが有料情報源とオープンソースとの、溝、現実的な問題。


ぐだぐだになってしまったが、今回の記事は敢えてこれでおしまいです。ただの日記ですから。近日中に有益な情報を発信予定。


今回の創作活動は約1時間30分(累積 約2,891時間)
(795回目のnote更新)


筆者はAmazonアソシエイト・プログラムに参加しています。(AmazonアソシエイトとはAmazon.co.jpの商品を宣伝し所定の条件を満たすことで紹介料をAmazon様から頂けるという大変ありがたい仕組みのこと。)
以下のリンクを経由してAmazonでお買物をするとその購入額の1~3%ほどのお小遣いが私に寄付されます(笑)以下のリンクを経由して頂ければ紹介商品以外のご購入でもOKですよ~。


読んでくれてありがとう。気長にマイペースに書いてます。この出会いに感謝😊