顔画像1枚で、同一人物を再現 Arc2Face　他 / Catch up on AI 2024.3.30

2024年3月31日 07:54

Pick up

一貫性のあるキャラクターの再現は、生成AI当初からの課題ですが、Arc2Faceは1枚の画像からキャラクター性を保ち、多様なバリエーションを生成できるフレームワーク。

ローカル版がリリースされておりWindows、Mac、Linuxで1クリックで利用可能。

Arc2Face-A Foundation Model of Human Faces
https://pinokio.computer/item?uri=https://github.com/cocktailpeanutlabs/arc2face

【顔画像1枚で、人物を再現】
Arc2Faceは、1枚の画像のみで、人物の特徴を捉えながら様々なバリエーションを生成できるGradioアプリ。

ローカル版がリリースされWindows、Mac、Linuxで1クリックで利用できるように。生成も高速で動画は等倍での速度。

続く>>#生成AI #AI pic.twitter.com/z3W6JK0H8l
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024

Catch up on AI

ホログラムの感覚に近い表現が可能なPOV Display

【ホログラムの感覚に近い表現が可能】
Persistence of vision display（POV Display）は国内でもたまに見かける、LEDを高速回転させて面を創り空間に映像が描画されているように見せるディスプレイ。

裸眼での空間コンピュータのデモに複数台おいて使ったら面白そう。pic.twitter.com/ntqPVKC1U5
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

MicrosoftとOpenAIが15兆円規模のデータセンター「Stargate」を計画

【15兆円のデータセンター】
MicrosoftとOpenAIが「Stargate」と言われる数百万台もの特殊なサーバーチップを搭載したスーパーコンピューターを含むデータプロジェクトを計画。

費用はおよそ1000億ドル（15兆円）とも言われている。計算資源で覇権を取られると、もう追いつけない可能性。

続く>> https://t.co/jp1a0U16lk
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

8秒以内で3DCGを生成できるGRM

【8秒以内で3DCGを生成】
GRMは、少ない枚数の写真から、8秒という時間で3Dモデルを作ることができる新しい3D生成AIフレームワーク。

先行研究と比べて、速度だけではなく、3Dモデルの質が高いことがされています。Image-to-3D、Text-to-3Dに対応可能です。

続く>>#生成AI #AI pic.twitter.com/vIjkqOtXJy
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

OpenAIが音声モデル Voice Engine を発表

【OpenAIが音声モデル発表】
Voice Engineは15秒の音声サンプルがあれば、元の話者に近い音声が生成できるというもの。

発表はされていますが、まだリリースはされていません。日本語はまだ驚くほど自然というわけではないがこれは時間の問題か...。

続く>>pic.twitter.com/deofu054Ur
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

荒い修正を補完する技術 Magic Fixup

【荒い修正を補完する技術】
Magic Fixupはざっくりとした切り貼りのような修正を補完してくれるフレームワーク。

元の画像の細かいディテールを残しながら、指定したレイアウトに合わせて再現してくれます。

続く>>#生成AI #画像生成AI pic.twitter.com/wZ7L0rfZ5I
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

動画内のオブジェクトを入れ替え VideoSwap

【動画内のオブジェクトを入れ替え】
VideoSwapは動画内に映る任意のオブジェクトを他のものに置き換えるフレームワーク。人間だけではなくて、猫・犬などの動物や、車・飛行機といった乗り物まで対応。

先行研究では難しかった、飛行機をヘリになど形状が違う物への置き換えも対応。
続く>>#生成AI pic.twitter.com/zJKI6jHBCZ
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 30, 2024

Gaussianとゲームの融合

【Gaussianとゲームの融合】
Gaussian Frostingを利用して現実世界をスキャンした3D Gaussian Splats上で騎士のアクション動画とカメラワークをつけたデモ。

Gaussian Frostingによって3DGSはさらに可能性が増した
続く>>#3D #3DGS pic.twitter.com/AvvD5tFadl
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024

IPAdapter v2とComfyUIで任意の服に着替える

【生成AIで任意の服に着替える】
IPAdapter v2とComfyUIを利用して、平置きした服を任意のモデルに着替えさせるチュートリアル。

ボタンなど細かいところは変わってしまっていますが、生成されたモデルへのフイット感がとても自然。ファッション・広告業界にとってはとても良いTips。#生成AI #AI https://t.co/tiDdHPVhtZ
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 29, 2024

AIのNewsやアートワーク情報を更新中⚡

X（Twitter）ではAIの最新情報を発信中🐦

https://x.com/taziku_co

この記事が気に入ったらサポートをしてみませんか？

顔画像1枚で、同一人物を再現 Arc2Face 他 / Catch up on AI 2024.3.30

Pick up

Catch up on AI

ホログラムの感覚に近い表現が可能なPOV Display

MicrosoftとOpenAIが15兆円規模のデータセンター「Stargate」を計画

8秒以内で3DCGを生成できるGRM

OpenAIが音声モデル Voice Engine を発表

荒い修正を補完する技術 Magic Fixup

動画内のオブジェクトを入れ替え VideoSwap

Gaussianとゲームの融合

IPAdapter v2とComfyUIで任意の服に着替える

AIのNewsやアートワーク情報を更新中⚡

X（Twitter）ではAIの最新情報を発信中🐦

顔画像1枚で、同一人物を再現 Arc2Face　他 / Catch up on AI 2024.3.30