見出し画像

猿なら出来るAIによる自動画像生成

 筆者のような面倒くさがりはプロンプトを考えることすら面倒なので以下の様なフローで画像を生成している

モデル図
  • 基本的にする作業は、定義ファイルの作成とモデルの選別である

  • スクリプトを動かした後にするのは公開用画像の抽出(キュレーション)だけである。指6本とか腕3本を弾く作業。月1回(高麗陶器を捨て値で輸入して選別品で儲けていた千利休にちなみ利休プロセスと呼んでいる)

  • 時間があればリテイクフローに流すが、労力に見合わないのであまりしない。

  • 普段する作業はマシンがコケたときの復旧とバージョンアップ時の不具合の修正で月1-2回

  • botはメタデータを抽出して投下する時のメッセージに利用している(JPEG用が面倒でインプリしていない……JPEGのメタデータはEXIFのコメントに入って居る。これの何が面倒かと言うと、TIFFを実装する作業とほぼ同じなのである。RustとCで書いたことはあるけどGASで書き直すのしんどい。しかもAIはこの系統のコードが苦手)

 この方法の最大の問題は、いいね押そうとしたら自分のアカウントであることである(ランダム投下だから1年前に選んだイラストが投下されても分からん)


今後やりたいこと

  • スクリプト作るのが面倒なのでAIに作成させる(現状、出力の8割書き直しだよ)

  • 定義ファイル作るのが面倒なのでAIに生成させたい(複雑すぎて他人が使えると思っていない)

  • キュレーションが面倒なので、そこで画像評価AIを作って自動抽出したい。問題は技術力が追いついていないのとAI用リソースが足りない。取りあえず、指の数と腕の数は自動検出したい。(目視で1万枚チェックするのしんどい)

  • キャプションを自動生成をしたい。生成AIにAPIで叩いて書かせるのが良いのかな?今はファイル名から生成している。

  • いっそのことAIもAIに作らせれば良くない?

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?