見出し画像

AI Weekly Report 2024/05/19

こんにちは。and_dという団体に所属している梅津です。

and_dのメンバーには、日々情報共有を行っていますが、これを機に個人的に気になるAI関連のニュースを週ごとにまとめてみることにしました。三日坊主にならないよう、継続を目指して頑張ろうと思います!



【NEWS】Chat GPT-4o

この1週間は「GPT-4o」の話題で持ちきりだったのではないでしょうか。
OpenAIが新たに発表した「GPT-4o」は、テキスト、音声、画像、映像をシームレスに扱えるAIモデルです。このモデルは、自然なテンポでリアルタイムの音声会話が可能で、視覚と音声の理解力が向上しています。
特に、応答速度が速くなったのとより自然な音声会話が可能になったことが印象的でした。


【ComfyUI】GPT-4oを組み込み、LLMの視覚機能を実現

新しい技術が出た時に、すぐに対応するところがComfyUIの好きなところです。GPT-4oを組み込めば、画像生成がより一層楽になりますね。


【ComfyUI】IC-Light

IC-Lightもここ最近、一番の衝撃でした。画像生成をしてる際にライティングがおかしくなってしまうことが多々あるのですが、これを使えばより整合性のある画像が生成できます。
建築情報学会MeetUpの時に知ってからすごい人だとは思っていましたが、さすが麻場さんって感じです笑


【Movie】AIを3Dレンダリングで使用する

AIを活用したクリエイティブ分野の参考例です。こういう使い方は積極的に取り入れていきたいですね。


【3D】Coin3D

今、自分がComfyUIでやろうとしていることがCoin3Dで研究されていてとても共感しました。
リアルタイム3D生成ももうすぐっぽいですね。


【3D】CAT3D

既存の画像の情報を使って、異なる角度から見た場合の画像を高精度で予測し、生成された画像を使って3Dモデルを構築しています。これには、NeRF(Neural Radiance Fields)や3D Gaussian Splatsなどの技術を使用してるみたいです。


【3D】CSM

CSM「Image to Model」の精度が上がったみたいなので、時間があれば試してみようと思います!
最近、3D生成AIの発展がより盛んになってきている気が…笑


【3D Space】Behavior Vision Suite

Behavior Vision Suite(BVS)は、AI技術を利用して高品質な3Dモデルやシーンを簡単に生成できるツールキットです。
ControlNetを常日頃使っている自分としては、シーンやオブジェクトをSegment/Depth/Normalで読み取っているところはなるほどな、と思いました。また、アノテーション付きのデータを用いてAIモデルをトレーニングすることで、シーン内のオブジェクトを認識し、その状態や位置関係を理解できるようにしてるみたいです。


ご案内

最近は生成AIを活用することでスタディをいかにクリエイティブにできるかを考えています。
また、画像生成AI活用やワークショップも多く承っていますので、お気軽にご相談ください!


この記事が気に入ったらサポートをしてみませんか?