マガジンのカバー画像

Catch up on AI

388
海外のAI関連のキャッチアップした情報をできる限り、noteでまとめていきます。
運営しているクリエイター

#3DGs

3DCG x 生成AIの可能性 他 / Catch up on AI 2024.5.20

Pick upAdobe Substance 3DとKrea aiで高精度な3D作品を生成 Catch up on AI4枚の画像で高品質3D生成 Gaussian ObjectYOLOでサインのみを検出AIコンテンツを見分けるSynthIDファションセンターしまむらがAIモデルChatGPTの音声はどのように選ばれたのか?AIによる事前面接 Apriora3Dジェネレーションアリーナ直感的な生成AIのコントロール ClickDiffusionAIのNewsやアートワーク情

スマホ1台でマークシートを採点するAI 他 / Catch up on AI 2024.5.19

Pick upこういった発想がすぐに形にできる世界へなりつつある。専用機などは便利ですがいずれ本当に特殊なものになっていく可能性。 Catch up on AIトランシーバー型生成AIハード Photoshop x 生成AI クリエイターと生成AIの可能性 アニメ可能な衣服を生成LayGA 暗闇でもロボットが動くためにDarkGS WEBやBLOGを自動で音声化 物を持った手を3D化HOLD CAT3Dの日常使いのシーン 行政での生成AI利活用検証から見えた1

GPT-4o x Media2FaceでAIに表情をつける 他 / Catch up on AI 2024.5.17

Pick up音声対話が高速になったGPT-4oを利用して、さらにそれにアバターをつけたデモ動画。ここにキャラクター性が加わればさらに拡がっていく可能性。 Catch up on AI複数の参照画像からポートレートを生成 Photoshopでリファレンスで着せ替え 手先が人間並みのヒューマノイド 画像1枚から1分以内に3DCGを生成 CAT3D 絵画やイラストから3Dシーンを生成Toon3 リアルタイムでノーマルマップを生成 DSINE SLAMから3DGS G

超高速で音声対話が可能なGPT-4o(Omni)がリリース 他 / Catch up on AI 2024.5.14

Pick up世界中がGPT-4o(Omni)の話題沸騰の1日。多くのデモや話題がX上でも Catch up on AIGPT-4o同士でミュージカル GPT-4oはテキストも描ける GPT-4oはAzure OpenAIでも GPT4-oでAI家庭教師 GrokにGPT4-oについて聞いてみた 仮想ライトフィールド IC-Light + IPAdapter さらに精度が高く高速にcreate_xyz x GPT-4o 3DGSでも試着を実現 Gaussian

生成AIの中割の進化の歴史 他 / Catch up on AI 2024.5.10

Pick up多くの生成AIの研究者などの一つの目標に中割りがある。様々なアプローチが日々試行錯誤されていますが、その進化の歴史をまとめたスレッド Catch up on AI音楽とアニメを生成AIで ボケた画像からシャープな3Dシーンを構築 アップルがクラウドでAI提供 ヒューマノイドのパルクール学習 ChatGPT Assistants APIがビジョンをサポート サッカーの選手を検知しながら平面へ ElevenLabsで楽曲生成 Stability AI

AutoDeskが3DAIモデルを発表 他 / Catch up on AI 2024.5.9

Pick up生成AIはどんどん一般化している。こうした業界標準のものに生成AIが搭載されればさらにその動きは広がる。 Catch up on AIセルルックをAIアニメに 3DCGから3DGSを生成 ComfyUIにIC-lightが登場 超高速のアップスケーラー キーフレームを選択して融合生成 考えたことが言葉に変わる 音楽生成AI Udioでインペイント機能 Appleの広告を逆再生で印象を変える AIのNewsやアートワーク情報を更新中⚡X(Twit

漫画も生成できるStoryDiffusionデモ 他 / Catch up on AI 2024.5.4

Pick up同一キャラクターで様々なシーンをプロンプトで制御できるStoryDiffusionのデモが公開。replicate上でデモを試すことが可能です。 story-diffusion Project: https://storydiffusion.github.io arXiv: https://arxiv.org/abs/2405.01434 Code: https://github.com/HVision-NKU/StoryDiffusion Demo:http

複数のキャラクターを保持して動画生成「Story Diffusion」 他 / Catch up on AI 2024.5.1

Pick up動画だけでは無く、漫画なども生成が可能。1シーンの解像度がどんどんと上がっていく。 Story Diffusion Project:https://storydiffusion.github.io Catch up on AIアメリカの新聞社8社がOpenAIとMicrosoftを著作権侵害で提訴 生成AIでPDF to Video 3Dシーンから指定オブジェクトを消す GScream シンプルなイラストタッチに動画変換 2〜4枚の画像から拘束に3D

キャラクター性を維持して動画を生成 ID-Animator 他 / Catch up on AI 2024.4.24

Pick up動画でも、画像1枚指定するだけで、キャラクター性を維持して一貫性の高い動画が生成できるフレームワークがID-Animatorが発表 ID-Animator: Zero-Shot Identity-Preserving Human Video Generation Project:https://id-animator.github.io arXiv:https://arxiv.org/abs/2404.15275 Code:https://github.com

道路の異常を検出をYOLO v8で実現 他 / Catch up on AI 2024.4.23

Pick upYOLO v8のライセンスは「GNU Affero General Public License v3.0」。条件のもと商用でも無料で利用することが可能。 これが大企業ではなく、個人エンジニアレベルで実現する可能性があるのは素晴らしい進歩だと思う。 Catch up on AIAIリアルタイムフェイスチェンジャー 川崎重工のヒューマノイドの歴史を辿る レストランでのウェイタードローン活用 スケッチ+リアルタイム生成AI Hyper-SD 最大8倍!動

一枚の画像と音声データから喋るアバターを生成「VASA-1」他 / Catch up on AI 2024.4.18

Pick up1枚の画像と音声データでこの滑らかさはすごい。4090でも生成可能なようです。コード・デモの公開が待ち遠しい。 VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time Project:https://microsoft.com/en-us/research/project/vasa-1/ arXiv:https://arxiv.org/abs/2404.10667 Catch up

顔画像1枚で、同一人物を再現 Arc2Face 他 / Catch up on AI 2024.3.30

Pick up一貫性のあるキャラクターの再現は、生成AI当初からの課題ですが、Arc2Faceは1枚の画像からキャラクター性を保ち、多様なバリエーションを生成できるフレームワーク。 ローカル版がリリースされておりWindows、Mac、Linuxで1クリックで利用可能。 Arc2Face-A Foundation Model of Human Faces https://pinokio.computer/item?uri=https://github.com/cockta

3Dガウシアンを舞台に「Gaussian Frosting」/ Catch up on AI 2024.3.24

Pick up3Dガウシアンで表面に特別な層を追加し、3DCGと連携したり編集が可能になる技術。 Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering Project:https://anttwo.github.io/frosting/ arXiv:https://arxiv.org/abs/2403.14554 Code:Coming Soon Catch up on A

3Dシーンで動的流体シミレーションGaussian Splashing (GSP) 他 / Catch up on AI 2024.1.31

Pick up3Dガウシアン・スプラフティングスで生成された3Dシーン上で、液体の流体シミュレーションが可能な技術。今まで見るだけだった、空間に対して様々な事象を反映することが可能です。 Gaussian Splashing: Dynamic Fluid Synthesis with Gaussian Splatting Project:https://amysteriouscat.github.io/GaussianSplashing/ arXiv:https://arx