見出し画像

Weekly Report 2024/07/31 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0146

小さい頃からタコを観るのが好きで、タコをモチーフにした作品制作チャレンジしていたのですが、複雑な構造も相まって中々納得のいく表現が出来ず何度も諦めていました。ですが、今回HAL(AI)に対してタコの追加学習する事で理解度が上がり、納得のできる作品に辿り着くことが出来ました。タコの生態も改めて調べると、他の生物とは異なる点が多く、宇宙を感じざるを得ないので"海と宇宙"をテーマに制作しました。クトゥルフ神話のモチーフに採用されるのも納得の生物です。近いうちに、まだ見れていなかったタコのドキュメンタリー映画「オクトパスの神秘: 海の賢者は語る」も見ようと思います。
作業BGM:Kraftwerk『Autobahn』


[お礼] ART POTLUCK トークイベント 『未来のAIについて-クリエイティブと肖像権と法律-』

初めてのトークイベントでしたが、とても楽しくディスカッションが出来てよかったです!登壇者の方々、artPotluck様、来てくださった方々ありがとうございました!


[お礼] Weekly Report 1周年

先週の記事で週報メモを開始してちょうど1年が経ちました。読んで下さってる皆様ありがとうございます。これからもコツコツと続けていこうと思います。


[ニュース] AI関連

[画像/動画] Meta - Segment Anything Model 2

SIGGRAPH 2024のキーノートに合わせて、SAM2が公開されました。マーク・ザッカーバーグさん、本当にありがとうございます。SAMはAI技術の中で、仕事でもプライベートでもかなり活用しているので、SAM2は本当に助かります。制作しているComfyUIのワークフローをSAM2に更新しないとですね。


[動画] Runway - Gen-3 Alpha Image to Video

遂にGen-3 AlphaでもImage to Video機能が搭載されましたね。ちょうど8月にもなりますし、Unlimitedプランで検証しまくろうと思います。


[動画] ShengShu - Vidu

4月の末に発表されて話題になっていたViduも一般公開されました。他の動画生成サービス系の中でも、APIが扱えるというのはViduだけですね。Image to Video機能も初めからは使えるので、こっちも検証してみます。


[動画] Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models

遂にローカル環境でも実行可能な、精度の高い動画生成のフレームワークが公開されました。モデルも公開されてますし、これは活用の幅が広がりそうです。夏休みの研究にしようと思います。


[対談] SIGGRAPH 2024 keynote - nVidia CEO ×Meta CEO

SIGGRAPHはフアンさんのホームなので、かなりリラックスしてるように見えますね。ザッカーバーグさんもSIGGRAPHに合わせてSAM2を公開したり、VRやオープンソースについての議論など興味深い話ばかりでした。


[LLM] OpenAI - Advanced Voice Mode

一部のChatGPT Plusユーザーにアドバンスボイスモードの提供を開始。GPT4oの発表の際一番感動した機能なので、触ってみたいですね。


[画像] Midjourney - V6.1

MJのアップスケールはちょっと精度が低いイメージだったので、新しいアップスケールの精度がどの様に変化したのか気になります。


[動画] Stability.ai - Stable Video 4D

Stability.aiから映像をアニメーション付きのNeRF化するモデルが発表されましたね。具体的な活用方法がARぐらいで、他にそこまで想像できないので他の活用の仕方が楽しみです。


[講演] SIGGRAPH 2024 - nVidia × Wonder Dynamics

「Revolutionizing Visual Effects and Animation With Generative AI」このセッションはかなり興味あります。後日まとめて頂けるとありがたいです。


[ComfyUI] CatVTON (バーチャル試着)

OOTDiffusionベースでワークフローを作ったばかりですが、もう新しいのが出ちゃいましたねw こっちでも検証して良い所を混ぜて新しいワークフローを制作しようと思います。IMAGDressing-v1との比較したいですね。


[画像] Canva × Leonardo.Ai

CanvaがLeonardo.Aiを買収しました。この動きは素晴らしいですね。資料制作はCanvaで行っているのでありがたいです。


[データセット] 著作権に配慮した画像生成AI開発用データ約1000万個を無償公開

これは嬉しいですね。CommonArtの開発も楽しみです。


[LLM] Meta - AI Studio 展開

パーソナルなAIチャットボットを制作し、共有できるクリエイター向けのツールです。FacebookやInstagramを持っているので、この手の学習は強いですね。AI Studioで自分のチャットボットかHALのチャットボットを作ってみたいですね。


[データセット] ThePioneer - japanese-photos

このデータセットは素晴らしいですね!自分もパーソナルすぎる写真以外でしたら、同じような形でデータセットを公開してみたいと思いました。いっそ、CC0のデータセットを作る為のアップロードサービスなどあったらいいですね。


[講演] SIGGRAPH 2024 - What’s Next in AI: NVIDIA’s Jensen Huang Talks With WIRED’s Lauren Goode

これは後でじっくり見ます。


[画像] Fotographer AI - Fuzer v0.1

商品の一貫性を保ちながら、背景に馴染ませつつ生成するフレームワーク。自分も悩んでいる部分なので、解析してComfyUIで再現するチャレンジをしてみたいと思います。


[記事] Ryzen/Radeon向けの画像生成AI「Amuse 2.0 Beta」。Stable Diffusionベース

nVidiaに対抗して、AMDも下地を固め始めてきましたね。AI CPUの生成速度が気になるところです。


[企業] nVidia - SIGGRAPH2024 NVIDIAResearch

凄い量の動画ですね。時間がある時にちょこちょこ見ていこうと思います。


[GPU] GPUStack

GPUをクラスター化してLLMなどを展開できる?GPUを山ほど持っているので、それらを統合して使えたら最高ですね。これも夏休みの自由研究にしようと思います。


[動画] PixVerse - PixVerse V2

PixVerseも他の動画生成サービスに負けじとアップデートしてますね。シーンとクリップの機能は珍しいです。


[記事] マイクロソフト 4~6月決算 増収増益 最終利益3兆3700億円

マイクロソフト頑張って下さい。


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[キャラクター] Vroid - Unreal Engine向け VRoid SDK


[JangaFX] LiquiGen 公開


この記事が気に入ったらサポートをしてみませんか?