見出し画像

第三回生成AIなんでもLT会感想

まず最初に当日の発表資料公開をば。説明しきれなかったこといっぱいあるなぁ。

資料URL

アプリ&ソース配布

stable-diffusion-webui-forgeビルド関連

陰影LoRA(コピー機LoRA)

線画→疑似3D画像CN学習

その後の研究進捗(現在進行形)

つまり月須和さんがすごい

各発表感想

お家で簡単GPUサーバー ProxmoxでGPU環境をぶっこわす

だだっこぱんだ(@ddPn08)さんによる、なんとも過激なタイトルですがProxmoxの紹介でした。
発表だけでは把握できないことがあったので、こちらの補足資料が助かりました。色々勉強しなきゃな・・・

latent surfing

teftef(@hanyingcl)さんによる、GANとDiffusionモデルについてのお話でした。
私はそもそもGAN?pix2pix??なにそれおいしいの???な状態でこの世界に参入したので、GANの話について伺えるのは貴重で興味深かったです。

動画生成AIによるシミュレーション動画は物理法則を満たしているのか

だだ茶豆さんによる、Soraの物理法則検証についてのお話でした。
物理屋さんのお話なので理解できるかなと不安だったたのですが、素人向けに最初に軽い解説をしてくれたのでありがたかったです。
動画生成系も触りたいなぁ。

ノンプログラマーがAiを駆使してControlNetモデルを作成するまでの格闘

YUiCHI(@YUiCHI_Bi)さんによるControlNet開発者にとっては涙なしに聞けない研究の軌跡でした。わかる・・・!!!!本当にCN開発やっている人少なくて苦しいよね!!!わかる!!!!!(個人的に思い入れナンバーワン発表)
自分も純エンジニアではない(主観として)のでめちゃくちゃ共感しました。建築分野での活用、できたら絶対楽しいですね。

層に着目したLLMの口調の学習について

sergicalsixさんによるLLM学習についてのお話でした。
LLMの語尾について自分は形態素解析で文末の語尾を変換するアプローチを考えていたんですが、考えてみれば学習させちゃうのも全然ありなんですよね。
うーー!LLMも触らないとなぁ。

ComfyUIをフル活用して画像生成AIサービスを作ってる話

teppei.fujisawaさんによるアパレル業界での活用例でした。
あーーーーそういえばComfyUIって手ありましたね。自分、ノードベースが苦手でうっかり自作アプリのバックエンド起用の選択肢からComfyUIを外していたんですが全然ありやんけ!ということに気付いた発表でした。
喰わず嫌いよくないね・・・。

AIアップスケーラーの創造性と一貫性

ShionさんによるAIアップスケーラーについてのお話でした。
自分はアップスケーラーについてはReal-ESRGANで止まっていたので、それ以外の話が聞けて面白かったです。
この分野ももっと勉強したら面白いもの作れそうですね!

以上、AI素人のとりにく目線による感想でした!!!!!!


この記事が気に入ったらサポートをしてみませんか?