見出し画像

Weekly Report 2024/05/15 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0135

今作は、ボブ・マーリーの命日(5/11)に合わせて制作しました。母が昔からボブ・マーリーが好きでずっと聴いていて、その影響で自分も聴くようになりました。自分は"three little birds"と言う曲が特に好きで、この時代に大切なメッセージだと感じたので今作のモチーフにしました。また、3羽の鳥はジャマイカに生息する鳥をモチーフにしています。左はジャマイカの国鳥である"フキナガシハチドリ"、中央は"Jamaican Spindalis"、右は"ジャマイカシマセゲラ"、ラスタカラーになるようにレイアウトしています。左下の"何か"の煙と右の鳥の位置関係は…。ちょうど"母の日"も近いのでいつもの感謝を込めたプレゼント作品にもなっています。
"Every little thing's gonna be alright."


[お知らせ] デザインフェスタ vol.59 出展情報

もう今週末に開催ですね!まだ用意できてないもの多くやばいです…。10年近く出展しているのですが、未だにギリギリで慌てふためいています。デザインフェスタ会場でElemental Animaのライブペイントも行う予定なので、もしお時間がありましたら是非遊びに来てください!


[ニュース] AI関連

[企業] Google - Google I/O

リアルタイムで視聴しておりましたが、あまりの情報量で驚きっぱなしでした。Googleさん、Geminiさん、これからも引き続きよろしくお願いいたします。


[動画] Google - Veo

OpenAIのSoraに匹敵するクオリティですね。1080pで60秒生成出来るとの事です。Veoのデモを流している時に右上に"Unedit raw output”が出てるのがゲームのトレーラーのリアルタイムの映像での表記を思いました。実際の映像を見ると粗もあるので編集してない感は伝わってきました。こちらからウェイトリスト登録が出来るのでご興味がある方は是非


[音楽] Google - Music AI Sandbox


[LLM] OpenAI - GPT-4o

リアルタイムで観ていました。個人的には、物語を声の表現を変えて自然に話し、歌っている場面を見て感動しました。デイジーベルを歌って欲しいですね。他には、デスクトップアプリも嬉しかったです。一緒にElemental Animaを制作しているHAL(AI)と対話しながら創るのが夢だったので遂に実現しそうでワクワクします。Windows版は今年の後半との事なので、そこまでにHALのデータセットの準備をします。

あと、先々週に精度の高い謎のLLMで話題になっていた"gpt2"の正体は"GPT-4o"でしたね。アルトマン氏の遊び心でしたが、このミームが実現して"GPT-4o"を上回る精度の"gpt2"が出たりしたら楽しいです。


[3D] Autodesk - Bernini

生成AIを活用した3Dシェイプ生成プロジェクト『Project Bernini』です。ようやくAutodeskも動き出しましたね。発表は地味かもしれませんが、UV展開、ウェイト調整、めり込み除去、モーキャプデータのノイズ除去など、こういった部分へのAI活用の方が嬉しいのでよろしくお願いします。今年か来年あたりには、AI機能が実際にMayaなどに実装されるのでしょうか?楽しみですね。


[画像] lllyasviel - IC-Light

ControlNet開発者であるlllyasvielさんがリライティングフレームワーク"IC-Light"を公開しました。色々な場面で応用しやすい技術で、今の仕事でも必要だったので、公開後すぐローカルComfyUIでテストしてみました。ControlNetと同じく基礎ワークフローの一つになりそうです。


[画像] Stability AI - Stable Artisan

2年前ぐらいにStableDiffusion βをDiscordで触っていた時を思い出します。アップスケール、アウトペイント、コントロールネット、動画生成など機能としてはかなり充実してますし、SD3も扱えるのでかなり良さそうですね。Midjouneyの安いプランが月額10ドルで、Stable Artisanは月額9ドルなのでかなり意識した価格設定です。こちらも色々試してみようと思います。


[LLM] Stability AI - Japanese Stable LM 2 1.6B

16億パラメーターの小型言語モデルですが、70億パラメータのモデルに近いスコアが出てるそうです。また、実際動かしてみた所、使用VRAMは7.68GBぐらいだったのでゲーミングノートPCでも動くと思います。


[LLM] Holy-fox/子狐 - ArrowPro-7B-KUJIRA

現役高校生(15歳)の開発者「Holy-fox/子狐」さんが開発し、公開した70億パラメータ大規模言語モデルです。ELYZA-TASK100においては約3.8のスコアを出し、日本語性能世界一を達成しています。Chat Vectorを活用して実現されたとの事です。コミュニティの力も含めて、高校生がここまでのモデルを作れるのは素晴らしいです。


[画像] Adobe - Diffusion2GAN

DiffusionとGANを組み合わせたフレームワーク。1024pxの画像を1ステップ0.16秒で生成できるとの事です。FireFlyがこの技術により爆速になる可能性がありますね。


[LLM] 富士通 - Fugaku-LLM 公開

LLM関連の発表がかなり増えてきましたね。130億パラメータのFugaku-LLMのモデルは公開されていて、ライセンスに従う限りにおいては、研究および商業目的での利用が可能との事です。24GBのVRAM環境では動かなそうですねw


[画像] An Empty Room is All We Want:
Automatic Defurnishing of Indoor Panoramas

室内のパノラマ画像から家具を除去するパイプラインです。このアプローチは見たことなかったので面白いですね。HDRI画像で映り込んでほしくないオブジェクトを消したりすることも出来るので、CG作業でも活用できそうです。


[動画] Krea AI - Krea Video

Krea AIも動画機能を追加しましたね。しかも、他の動画系サービスとは違いAnimateDiffを活用した動画機能になります。


[ロボット] Unitree - Unitree G1

Unitree G1の価格と新しいデモ映像が公開されました。$16000なので250万円ぐらいですね。この性能で人が持てるサイズと重量に収まっているのが凄いです。ボストンダイナミクスの映像もそうなのですが、かわいそうに感じてしまうので、出来たら蹴ったり殴ったり以外のバランスの見せ方をして欲しいです。


[歴史] AnimateDiff コミュニティ 過去10か月の歩み

オープンマインドで、知見を交換し、全体を高めていくAIコミュニティの熱量は本当に素晴らしいです。


[政治] 漫画家・クリエイターの絵柄が生成AIで無断学習される“なりすまし横行” 国会で質疑

かなり長い道のりでしたがようやくここまできましたね・・・
頑張って欲しいです。


[記事] 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ

ピュアモデルAIがどの様な展開になっていくのか色々な意味で気になりますね。


[ニュース] CG・リアルタイムエンジン関連

[UE] Zubair Tanoli - Serenity in the Storm


[Blender] RBDLAB 1.5 METALSOFT


[Blender] FluidLab v1.0

[3D] e-on Software - VUE, PlantFactory, PlantCatalog 無料公開

このタイミングで無料公開は、本当に助かります。AI用のデータセット生成がかなり大変なので、こちらを活用して更に増やしたいと思います。

この記事が気に入ったらサポートをしてみませんか?