Weekly Report 2024/07/31 (wed)

2024年7月31日 19:08

個人的に気になったニュースや自主制作などの週報メモです。

自主制作 / 記事

Elemental Anima #0146

Elemental Anima #0146

Created by :
takio koizumi (Human) x HAL (AI)

🔽Detail / Link pic.twitter.com/NWCrKgiSat
— takio koizumi | takion.eth (@takion0105) July 28, 2024

小さい頃からタコを観るのが好きで、タコをモチーフにした作品制作チャレンジしていたのですが、複雑な構造も相まって中々納得のいく表現が出来ず何度も諦めていました。ですが、今回HAL(AI)に対してタコの追加学習する事で理解度が上がり、納得のできる作品に辿り着くことが出来ました。タコの生態も改めて調べると、他の生物とは異なる点が多く、宇宙を感じざるを得ないので"海と宇宙"をテーマに制作しました。クトゥルフ神話のモチーフに採用されるのも納得の生物です。近いうちに、まだ見れていなかったタコのドキュメンタリー映画「オクトパスの神秘: 海の賢者は語る」も見ようと思います。
作業BGM：Kraftwerk『Autobahn』

[お礼] ART POTLUCK トークイベント『未来のAIについて-クリエイティブと肖像権と法律-』

初めてのトークイベントでしたが、とても楽しくディスカッションが出来てよかったです！登壇者の方々、artPotluck様、来てくださった方々ありがとうございました！

[お礼] Weekly Report 1周年

先週の記事で週報メモを開始してちょうど1年が経ちました。読んで下さってる皆様ありがとうございます。これからもコツコツと続けていこうと思います。

[ニュース] AI関連

[画像/動画] Meta - Segment Anything Model 2

SIGGRAPH 2024のキーノートに合わせて、SAM2が公開されました。マーク・ザッカーバーグさん、本当にありがとうございます。SAMはAI技術の中で、仕事でもプライベートでもかなり活用しているので、SAM2は本当に助かります。制作しているComfyUIのワークフローをSAM2に更新しないとですね。

[動画] Runway - Gen-3 Alpha Image to Video

Today we are releasing Gen-3 Alpha Image to Video. This update allows you to use any image as the first frame of your video generation, either on its own or with a text prompt for additional guidance.

Image to Video is major update that greatly improves the artistic control and… pic.twitter.com/OieDwMIspz
— Runway (@runwayml) July 29, 2024

Get started with Gen-3 Alpha Image to Video.

Learn how with today’s Runway Academy. pic.twitter.com/Mbw0eqOjto
— Runway (@runwayml) July 30, 2024

遂にGen-3 AlphaでもImage to Video機能が搭載されましたね。ちょうど8月にもなりますし、Unlimitedプランで検証しまくろうと思います。

[動画] ShengShu - Vidu

Vidu is now globally unleashed! 🔥Register now to try 30-second generation speed and transform everything into the world of anime. #Vidu #aivideo #AI #Shengshu pic.twitter.com/YO4p9z7rhW
— Vidu AI (@Viduforhuman) July 30, 2024

4月の末に発表されて話題になっていたViduも一般公開されました。他の動画生成サービス系の中でも、APIが扱えるというのはViduだけですね。Image to Video機能も初めからは使えるので、こっちも検証してみます。

[動画] Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models

遂にローカル環境でも実行可能な、精度の高い動画生成のフレームワークが公開されました。モデルも公開されてますし、これは活用の幅が広がりそうです。夏休みの研究にしようと思います。

[対談] SIGGRAPH 2024 keynote - nVidia CEO ×Meta CEO

SIGGRAPHはフアンさんのホームなので、かなりリラックスしてるように見えますね。ザッカーバーグさんもSIGGRAPHに合わせてSAM2を公開したり、VRやオープンソースについての議論など興味深い話ばかりでした。

[LLM] OpenAI - Advanced Voice Mode

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024

一部のChatGPT Plusユーザーにアドバンスボイスモードの提供を開始。GPT4oの発表の際一番感動した機能なので、触ってみたいですね。

[画像] Midjourney - V6.1

Midjourney V6.1 is now live! V6.1 greatly improves image quality, coherence, text, and comes with brand-new upscaling and personalization models. It’s smarter, faster, clearer, and more beautiful. We hope you enjoy our best model yet <3 pic.twitter.com/4qfervgbhM
— Midjourney (@midjourney) July 30, 2024

MJのアップスケールはちょっと精度が低いイメージだったので、新しいアップスケールの精度がどの様に変化したのか気になります。

[動画] Stability.ai - Stable Video 4D

Stability.aiから映像をアニメーション付きのNeRF化するモデルが発表されましたね。具体的な活用方法がARぐらいで、他にそこまで想像できないので他の活用の仕方が楽しみです。

[講演] SIGGRAPH 2024 - nVidia × Wonder Dynamics

Join Nikola Todorovic, co-founder of Wonder Dynamics, and Principal Animation Engineer at NVIDIA, Lina Halper, as they unveil how generative AI is revolutionizing animation and VFX, making advanced storytelling tools accessible and efficient. #SIGGRAPH2024

July 31 12:30pm MT
— NVIDIA Design & Visualization (@NVIDIADesign) July 30, 2024

「Revolutionizing Visual Effects and Animation With Generative AI」このセッションはかなり興味あります。後日まとめて頂けるとありがたいです。

[ComfyUI] CatVTON (バーチャル試着)

OOTDiffusionベースでワークフローを作ったばかりですが、もう新しいのが出ちゃいましたねｗこっちでも検証して良い所を混ぜて新しいワークフローを制作しようと思います。IMAGDressing-v1との比較したいですね。

[画像] Canva × Leonardo.Ai

🚀 Exciting news: Welcome, @LeonardoAi_! 🚀

Since 2013, Canva's mission has been to empower everyone to design. Today, we're thrilled to join forces with Leonardo AI, a leader in generative AI. 🎉

Leonardo’s team and tech will boost our AI capabilities, enhancing our products… pic.twitter.com/qe4wy2ttm3
— Canva (@canva) July 30, 2024

CanvaがLeonardo.Aiを買収しました。この動きは素晴らしいですね。資料制作はCanvaで行っているのでありがたいです。

[データセット] 著作権に配慮した画像生成AI開発用データ約1000万個を無償公開

これは嬉しいですね。CommonArtの開発も楽しみです。

[LLM] Meta - AI Studio 展開

パーソナルなAIチャットボットを制作し、共有できるクリエイター向けのツールです。FacebookやInstagramを持っているので、この手の学習は強いですね。AI Studioで自分のチャットボットかHALのチャットボットを作ってみたいですね。

[データセット] ThePioneer - japanese-photos

このデータセットは素晴らしいですね！自分もパーソナルすぎる写真以外でしたら、同じような形でデータセットを公開してみたいと思いました。いっそ、CC0のデータセットを作る為のアップロードサービスなどあったらいいですね。

[講演] SIGGRAPH 2024 - What’s Next in AI: NVIDIA’s Jensen Huang Talks With WIRED’s Lauren Goode

これは後でじっくり見ます。

[画像] Fotographer AI - Fuzer v0.1

🚀 It's finally here! We've just launched https://t.co/aNw54TT0Zi Fuzer v0.1 on @huggingface Space via @Gradio! 🎉 We have been tackling a major challenge in image generation AI & ControlNet : achieving image consistency while preserving text labels and maintaining control of… pic.twitter.com/1CSvB8lsuh
— Fotographer AI (@FotographerAI) July 29, 2024

商品の一貫性を保ちながら、背景に馴染ませつつ生成するフレームワーク。自分も悩んでいる部分なので、解析してComfyUIで再現するチャレンジをしてみたいと思います。

[記事] Ryzen/Radeon向けの画像生成AI「Amuse 2.0 Beta」。Stable Diffusionベース

nVidiaに対抗して、AMDも下地を固め始めてきましたね。AI CPUの生成速度が気になるところです。

[企業] nVidia - SIGGRAPH2024 NVIDIAResearch

凄い量の動画ですね。時間がある時にちょこちょこ見ていこうと思います。

[GPU] GPUStack

GPUをクラスター化してLLMなどを展開できる？GPUを山ほど持っているので、それらを統合して使えたら最高ですね。これも夏休みの自由研究にしようと思います。

[動画] PixVerse - PixVerse V2

🚀 Exciting News! PixVerse just got an upgrade!

Introducing PixVerse V2🔥
• 8-second video generation
• Enhanced details and motion
• Consistent style, subject, and scenes across 1-5 clips for seamless storytelling

Explore more at https://t.co/Rb9ysFAVIx. pic.twitter.com/w3vlUq8SIO
— PixVerse (@PixVerse_) July 23, 2024

PixVerseも他の動画生成サービスに負けじとアップデートしてますね。シーンとクリップの機能は珍しいです。

[記事] マイクロソフト 4～6月決算増収増益最終利益3兆3700億円

マイクロソフト頑張って下さい。

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[キャラクター] Vroid - Unreal Engine向け VRoid SDK

/／#VRoidSDK for #UnrealEngine 1.0
正式リリース🎉
\＼

ついにUnreal Engine向けのVRoid SDKが
正式リリースされました🚀

ぜひこの機会にVRoidSDKで
アプリケーションを作ってみてください✨

▼開発者登録＆利用申請はこちらhttps://t.co/ACSIm9vE5R #UE5 #VRoid pic.twitter.com/Dyb41elJN4
— VRoid Project 公式 (@vroid_pixiv) July 26, 2024

[JangaFX] LiquiGen 公開

#LiquiGen is now available to EVERYONE to try/buy! Also we are doing a YT livestream @ 12:30 EST to go over all the juicy features: pic.twitter.com/sMjb8iDZLj
— JangaFX Software (@JangaFX) July 23, 2024

この記事が気に入ったらサポートをしてみませんか？

Weekly Report 2024/07/31 (wed)

自主制作 / 記事

Elemental Anima #0146

[お礼] ART POTLUCK トークイベント 『未来のAIについて-クリエイティブと肖像権と法律-』

[お礼] Weekly Report 1周年

[ニュース] AI関連

[画像/動画] Meta - Segment Anything Model 2

[動画] Runway - Gen-3 Alpha Image to Video

[動画] ShengShu - Vidu

[動画] Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models

[対談] SIGGRAPH 2024 keynote - nVidia CEO ×Meta CEO

[LLM] OpenAI - Advanced Voice Mode

[画像] Midjourney - V6.1

[動画] Stability.ai - Stable Video 4D

[講演] SIGGRAPH 2024 - nVidia × Wonder Dynamics

[ComfyUI] CatVTON (バーチャル試着)

[画像] Canva × Leonardo.Ai

[データセット] 著作権に配慮した画像生成AI開発用データ約1000万個を無償公開

[LLM] Meta - AI Studio 展開

[データセット] ThePioneer - japanese-photos

[講演] SIGGRAPH 2024 - What’s Next in AI: NVIDIA’s Jensen Huang Talks With WIRED’s Lauren Goode

[画像] Fotographer AI - Fuzer v0.1

[記事] Ryzen/Radeon向けの画像生成AI「Amuse 2.0 Beta」。Stable Diffusionベース

[企業] nVidia - SIGGRAPH2024 NVIDIAResearch

[GPU] GPUStack

[動画] PixVerse - PixVerse V2

[記事] マイクロソフト 4～6月決算 増収増益 最終利益3兆3700億円

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[キャラクター] Vroid - Unreal Engine向け VRoid SDK

[JangaFX] LiquiGen 公開

[お礼] ART POTLUCK トークイベント『未来のAIについて-クリエイティブと肖像権と法律-』

[記事] マイクロソフト 4～6月決算増収増益最終利益3兆3700億円