マガジンのカバー画像

Catch up on AI

388
海外のAI関連のキャッチアップした情報をできる限り、noteでまとめていきます。
運営しているクリエイター

#SDXL

SDXLとAnimateDiffで生成されたペーパークラフトアニメ 他 / Catch up on AI 2024.1.7

Pick up動画はiPhoneで撮影し、スタイルはIPAdapterによって再現しているとのことです。スケボーの習い事とかで、アニメだとプライバシー配慮がなされているので良いというご意見もあったのですが、そういう使い方も考えられますね。 IPAdapterの入力で大きく出力が異なるのが面白い。 Catch up on AIAI動画のもう一つの可能性「AI VFX」 汎用ヒト型AIロボットも革新的な進化が!? アート作品の無限ループ「Infinite Art Trav

SDXLが更に進化!「DPO-SDXL」他 / Catch up on AI 2023.12.20

Pick upSDXLの精度をさらに向上させた、DPO-SDXL登場。かなり人間の頭の中で思い描くものと近づいてきた。人間の描写も細部上がっており、手、歯、目線など細部のクオリティが向上している。 DPO-SDXL arXiv:https://arxiv.org/abs/2311.12908 dpo-sdxl-merged :https://huggingface.co/dataautogpt3/dpo-sdxl-merged SDXL-DPO: https://hugg

画像生成AIのReadout Guidance 他 / Catch up on AI 2023.12.6

生成した画像を様々な形で制御可能な生成AI「Readout Guidance」。様々な方法で生成した画像を制御可能な技術。 生成AIの画像調整が利便性が大きく向上しそうです。 Readout Guidance Project:https://readout-guidance.github.io arXiv:https://arxiv.org/abs/2312.02150 code:ComingSoon Catch up on AI一枚の画像から再現性の高いアバターを生成

長時間の一貫性のある動画を生成するための技術VideoDirectorGPT 他 / Catch up on AI 2023.9.27

Pick up基本生成AIによる動画生成は一貫性を保つために短い動画を生成することに特化している場合が多いですが、VideoDirectorGPTはLLMを利用することで、一貫性のある長時間動画を生成可能にする技術。 VideoDirectorGPT https://videodirectorgpt.github.io Catch up on AISDXLの背景置き換え生成AI「SDXL Background Replacement for Product Images」

Stable Diffusion WebUI 1.6.0がリリース 他 / Catch up on AI 2023.8.16

Pick up様々な新機能やバグフィックスを含んだStable-DSiffusion-WebUI 1.6.0がリリースされました。 内容をチェックして必要なものがあればアップデートを! Catch up on AI自然言語のプロンプトで画像内のオブジェクトを消去できる「Inst-Inpaint」 高度なビデオ解析を行う「supervision-0.13.0」がリリース 汎用音声ニューラルコーディック言語モデル「SpeechX」 Vision Pro時代の製品デモ リ

群馬県が2つのコンテストで生成AIの仕様を認める 他 / Catch up on AI 2023.8.13

Pick up今回は国、県などを含め生成AIに対しての動きが凄く早い。今までの行政ではありえないスピード感。何かが動いているのを感じる。 原文:https://tokyo-np.co.jp/article/269870 Catch up on AISDXL1.0でのLoRAのトレーニングチュートリアル動画 AIで現実世界のスケッチを3D生成 空撮や報道映像を使って報道でのNeRF活用実験 3Dの表面メッシュを最適化するための新手法「FlexiCubes」 生成AI

Metaの音声生成の「AudioCraft」の全機能が利用可能に! 他 / Catch up on AI 2023.8.3

Pick upMusicGenに加え、音声が生成できるAudioGen、より高度な音楽が生成できるEnCodecが利用できるようになりました。MusicGenでも十分素晴らしいクオリティでしたが、EnCodecがどのくらい精度が上がっているか気になります。 AudioCraft News:https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/ Git:https:

LLMで画像生成をサポート数や服の色などを完璧に指定「LLM-grounded Diffusion」 他 / Catch up on AI 2023.7.30

Pick up画像生成をしているとありがちなのが、1girlと入れても2人、3catと入れてもたくさんの猫。一つの画面で複数の条件を入力すると確実に反映されない事象に悩まされることも多いと思います。 このLLM-grounded DiffusionはLLMを利用し、アプローチすることで、完璧に指示を反映させることができるという技術です。まだ論文段階だが今後に期待したい技術です。 Catch up on AISDXLベースモデルで生成→SDXL Refinerモデルで再生成

SDXL 1.0の設定の効果を試せる「SDXL 1.0 A Replicate guide」 他 / Catch up on AI 2023.7.29

Pick up生成AIではパラメーターの特性を掴むことがクオリティを上げる第一歩ですが、一つずつ生成していると時間がかかるものです。「SDXL 1.0 A Replicate guide」はSDXL 1.0の設定の効果を一気に試せます。 Catch up on AIDeepMindが新たに開発した「Robotic Transformer 2(RT-2)」。新しい視覚-言語-行動(VLA)モデルを搭載 いつか来るAIワークシーン 生成AIを利用して、YOASOBIっぽい曲

1枚の画像からダンスを生成可能な生成AI「DisCo」 他 / Catch up on AI 2023.7.28

Pick upReferenceとして1枚の画像を読み込ませるとその人間の顔、服装でダンスを生成できる「DisCo」。今まで一枚ずつ顔を変換して動きを変換してと作業していましたが、かなり高精度でダンスムービーを生成することが可能です。 DisCo: Disentangled Control for Referring Human Dance Generation in Real World Project:https://disco-dance.github.io/ind

Stable Diffusion XL (SDXL) 1.0がリリース 他 / Catch up on AI 2023.7.27

Pick upStable Diffusion XL (SDXL) 1.0が正式にリリースされ、Gitにも公開され、ダウンロードして利用できるようになりました。 様々なアップデートがなされています。今後順次紹介していければと思っております。 Amazon BedrockにもStable Diffusion XL (SDXL) 1.0がリリースされています。 Catch up on AINetflixがAIプロダクトマネージャーを募集。最大の報酬は1億を超えています。夢が

StableDiffusionの最新版SDXLでは学習効率もアップ 他 / Catch up on AI 2023.7.10

Pick upRadditに投稿された記事によると、SDXLは描画だけでは無く、学習効率もかなりアップしているようで。StableDiffusionバージョン1.5では5000枚は必要だった学習が、SDXLでは、100枚の画像だけでスタイルを再現できるようになったとのこと。 現段階では気軽に学習させることは困難なようですが、今後に期待が持てる投稿です。 Raddit:Anime fans rejoice! It is incredibly easy to train a

動画生成AI「Pika Labs」の人物の一貫性が凄い 他 / Catch up on AI 2023.7.9

Pick up動画生成AI「Pika Labs」の人物の一貫性がとんでも無く高い。現状その他の動画生成AIでは人物を描画すると、一貫性があまり保たれず、人間としてはかなり違和感がある動画ができあがりますが「pikalabs」では正面から、会話をしていても大きく崩れること無く生成ができています。 Pika Labsはまだ公開前のサービスで、TwitterアカウントのDMやサイト上でアーリーアクセスを募集しています。 Pika Labs https://www.pika.ar