見出し画像

技術を試すな、技術を使え

ここ半年の中で、自分が一番衝撃を受けた記事が出てきた。

中々攻めている記事なのだが、この記事がいままでで一番、自分が危機意識を持つきっかけになった記事だった。このまま技術を試して、面白いね〜では駄目だ。技術は「誰でも使えて、少なくとも作品を作れる」レベルまで持っていかないと腐る。

ここ一年、様々な技術が出てきた。下記ツリーにまとめているが、少なくともテキストからイラストや音楽が作れて、イラストから動画が作れて、歌詞はChatGPTで作れて、歌詞をテキストアニメーションにできるツールもあるらしい。

自分は「こんなに色々な技術が来てるのに何で普及しないんだ?」と思ってたわけだけど、多分日本語圏において、生成AIは参入障壁が高い。半年前から知人に言われてたけど、ようやく完全に理解した。インストールボタン押して環境が構築されて、成果物が出る状態までをノンストップでできないと意味がない。gitのインストールとか各リポジトリのURL踏んでとか、CUDAの設定とかさせちゃ駄目。本当に日本に普及させるのであれば、英語のサイトに飛ばすとか禁止レベル。

自分は言語系の生成AI、所謂LLMで遊んでた人間で、最近画像生成でまた遊ぼうと思って、じゃあ何をすれば良いかな〜と調べたら本気でキレそうになった。LoRAのデータセットの整形して(協力していただいた人の画像解像度が4kだった)、データセットタグ登録用のツール落としてタグ登録して、kohya_ss落として環境構築して、モデル落としてそれに対応したLoRA作って、でcomfyUI落として環境構築してようやくt2i試せるの?しかもパラメータ全然わからないからLoRA効いてるかすらわからん、としあきスタデwikiありがとう…

エンジニアがこんだけキレそうになってるので、多分一般人誰もさわれない、確かに普及はこのままだと厳しい…

技術を試しに触るのは楽しい、エンジニアだったらパパッと環境構築して、こんな技術あるんだ、凄い、こんなこともできそうだね〜って話せる。でも「こんなこともできそう」から「一般人がこんなこともできるわこんな作品が作れる」にするには、インストールスクリプト組んだりWebUIを作ったりする必要がある。おもちゃから道具にする、そこに多分価値がある。

取り敢えず余裕と時間があって、でも最新技術作るほどの熱意はないな〜ってエンジニアは既存の技術をパパッと使えるツールを作ってOSSで公開したら面白いと思う。自分が当然にできることは他の人は当然にできない。

この記事が気に入ったらサポートをしてみませんか?