![見出し画像](https://assets.st-note.com/production/uploads/images/135661088/rectangle_large_type_2_667d6d016d2009354f70fddb00069062.png?width=1200)
顔画像1枚で、同一人物を再現 Arc2Face 他 / Catch up on AI 2024.3.30
Pick up
一貫性のあるキャラクターの再現は、生成AI当初からの課題ですが、Arc2Faceは1枚の画像からキャラクター性を保ち、多様なバリエーションを生成できるフレームワーク。
ローカル版がリリースされておりWindows、Mac、Linuxで1クリックで利用可能。
Arc2Face-A Foundation Model of Human Faces
https://pinokio.computer/item?uri=https://github.com/cocktailpeanutlabs/arc2face
【顔画像1枚で、人物を再現】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024
Arc2Faceは、1枚の画像のみで、人物の特徴を捉えながら様々なバリエーションを生成できるGradioアプリ。
ローカル版がリリースされWindows、Mac、Linuxで1クリックで利用できるように。生成も高速で動画は等倍での速度。
続く>>#生成AI #AIpic.twitter.com/z3W6JK0H8l
Catch up on AI
ホログラムの感覚に近い表現が可能なPOV Display
【ホログラムの感覚に近い表現が可能】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
Persistence of vision display(POV Display)は国内でもたまに見かける、LEDを高速回転させて面を創り空間に映像が描画されているように見せるディスプレイ。
裸眼での空間コンピュータのデモに複数台おいて使ったら面白そう。pic.twitter.com/ntqPVKC1U5
MicrosoftとOpenAIが15兆円規模のデータセンター「Stargate」を計画
【15兆円のデータセンター】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
MicrosoftとOpenAIが「Stargate」と言われる数百万台もの特殊なサーバーチップを搭載したスーパーコンピューターを含むデータプロジェクトを計画。
費用はおよそ1000億ドル(15兆円)とも言われている。計算資源で覇権を取られると、もう追いつけない可能性。
続く>> https://t.co/jp1a0U16lk
8秒以内で3DCGを生成できるGRM
【8秒以内で3DCGを生成】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
GRMは、少ない枚数の写真から、8秒という時間で3Dモデルを作ることができる新しい3D生成AIフレームワーク。
先行研究と比べて、速度だけではなく、3Dモデルの質が高いことがされています。Image-to-3D、Text-to-3Dに対応可能です。
続く>>#生成AI #AI pic.twitter.com/vIjkqOtXJy
OpenAIが音声モデル Voice Engine を発表
【OpenAIが音声モデル発表】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
Voice Engineは15秒の音声サンプルがあれば、元の話者に近い音声が生成できるというもの。
発表はされていますが、まだリリースはされていません。日本語はまだ驚くほど自然というわけではないがこれは時間の問題か...。
続く>>pic.twitter.com/deofu054Ur
荒い修正を補完する技術 Magic Fixup
【荒い修正を補完する技術】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
Magic Fixupはざっくりとした切り貼りのような修正を補完してくれるフレームワーク。
元の画像の細かいディテールを残しながら、指定したレイアウトに合わせて再現してくれます。
続く>>#生成AI #画像生成AI pic.twitter.com/wZ7L0rfZ5I
動画内のオブジェクトを入れ替え VideoSwap
【動画内のオブジェクトを入れ替え】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024
VideoSwapは動画内に映る任意のオブジェクトを他のものに置き換えるフレームワーク。人間だけではなくて、猫・犬などの動物や、車・飛行機といった乗り物まで対応。
先行研究では難しかった、飛行機をヘリになど形状が違う物への置き換えも対応。
続く>>#生成AI pic.twitter.com/zJKI6jHBCZ
Gaussianとゲームの融合
【Gaussianとゲームの融合】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024
Gaussian Frostingを利用して現実世界をスキャンした3D Gaussian Splats上で騎士のアクション動画とカメラワークをつけたデモ。
Gaussian Frostingによって3DGSはさらに可能性が増した
続く>>#3D #3DGSpic.twitter.com/AvvD5tFadl
IPAdapter v2とComfyUIで任意の服に着替える
【生成AIで任意の服に着替える】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024
IPAdapter v2とComfyUIを利用して、平置きした服を任意のモデルに着替えさせるチュートリアル。
ボタンなど細かいところは変わってしまっていますが、生成されたモデルへのフイット感がとても自然。ファッション・広告業界にとってはとても良いTips。#生成AI #AI https://t.co/tiDdHPVhtZ
AIのNewsやアートワーク情報を更新中⚡
X(Twitter)ではAIの最新情報を発信中🐦
この記事が気に入ったらサポートをしてみませんか?