見出し画像

2024年 新年のご挨拶

 皆さん、2024年、あけましておめでとうございます。
 本年もよろしくお願いいたします。

 昨年2023年は、生成AI元年とでもいえるような年でした。OpenAI社のChatGPTの劇的な普及については、改めて言及するまでもないと思いますが、画像生成AIについても、この1年で大きな成長を遂げたといえると思います。
 私は画像生成AIプラットフォームとしては、昨年1月からStable Diffusionを使い始め、3月に最初の画像をX(Twitter)に公開しました。

 Stability AI社がStable Diffusionを公開したのは、2022年8月でしたが、実際には、昨年から使い始めたという方が多いのではないでしょうか。

 私がAI画像を公開し始めた3月は、ちょうど、東アジア系の人物の描写能力にすぐれるStable Diffusionモデル(チェックポイント)の「ChilloutMix」が、マージ元モデルのライセンス問題で一時期公開を見合わせるという出来事があり、以降画像生成AIは様々な問題を抱えながらも、著しい発展を遂げてきました。
 私自身は、AIアートのクリエーターそのものというよりも、モデル製作者やAIクリエーターへの支援活動を主な活動として来ました。
 私は本業は産業機器向けの画像処理技術者・研究者で、本業でも生成AIを用いた画像処理の研究に携わっており、アート向け画像生成AI技術の習得や、AIの普及も、上記活動の動機の一つになってきました。
 一方で、自身がAIアートにかけられる時間が、曜日関係なく22:00から3時間程度に限られ、さらに、画像生成AIを始める前から所有していたノートPCのGPUスペックの制約もあって、AIアート活動でやりたいことのかなりのことができず、活動に限界を感じていました。
(SNSのフォロワーが増えないことも悩みでしたが、それ以上に、時間や生成環境の問題でやりたいことができないことが辛かったです)
 そのため、12月25日限りで、自身が生成したAI画像のSNS上での公開をやめる可能性を一旦は考えて、このような投稿になりました。

 ところが、これらの投稿のリアクションがないどころか、かえって大きな反響を呼んでしまい、結局は皆さんの温かい声にお応えして、2024年も活動継続することにしたのですが、そのためには、以下のような投資を伴う判断が必要でした。
 自身が所有してきたノートPCのGPUスペックの制約と先ほど書きましたが、具体的には、NVIDIA GeForce RTX2600 6GBです。
 Stable Diffusion 1.5の時代は、処理が遅かったものの、これで辛うじて運用できていたのですが(Tiled Diffusionのおかげで低スペックのPCでも高解像度画像を生成できた)、新たに登場したSDXLはこのスペックでは事実上歯が立たず、やむなくGoogle CloudのGPU仮想マシン(VM)を立ち上げて生成することにしました。
 そうして生成したSDXLの最初の画像がこれです。

 クラウドVMのGPUですが、A100はさすがに費用が高いため、L4を採用しました。OSはLinux(Ubuntu)、VRAMは24GBで、SDXLで1792x2304pixelまでの画像生成なら十分です。しかし、従量制で費用面から長時間使えない、VMのリソースが満員で使えないときがある、Linuxのリモートのため使いづらいという問題があり、今後AI画像生成を続けるなら、ローカルで運用できるそれなりのスペックのGPUのデスクトップPCの購入が必要と思っていました。
 AI画像の投稿を続けると決めたその日に購入したPCは、NVIDIA GeForce RTX4070Ti 12GB搭載で、31日の時点で稼働を始めていますが、ローカル環境でもSDXL含め短時間で多くの画像を生成できるようになりました。
(思い切ってRTX4090機も考えましたが、PCのサイズが非常に大きく自宅に置けないという問題もあり断念しました)

 というわけで、購入したPCの費用を回収するためにも、よほどのことがない限り今後少なくとも1年はAI画像の生成と投稿の活動を続けていきますので、よろしくお願いします。

この記事が気に入ったらサポートをしてみませんか?