記事一覧
口パク本命のEMOが出るまでは、VideoRetalkingで遊ぼう!
Emoが本命デモを見る限り、アリババのEMOが口パク/LipSync動画としては、ものすごい品質だ。 https://humanaigc.github.io/emote-portrait-alive/ SadTalkerの後継 のVide…
Flux.1 Inpaintを試す
結論 最適なinference stepを出すのが難しいそもそも、実験版だから、評価するべきではありませんが、使うとしたらの話
Number of inference stepsを上げると、そばかすみたいな、つぶつぶ/パターンが目立つ
一方、少ないと、顔にはまらない
この最適なステップを、少しつづ変更しながら見つけようとしてると、お試しGPUタイムが切れます。
結論平凡ですが、今後に期待と
Stable Diffusion ガールとレディー・ウーマンのタグの結果を比較
Beautiful Girl/Lady/Womenのどれがいいかな?
違いが気にならなければ、気にしなくていい。
もちろん、GirlでもSeedによっては、面長になることもあるので、ややなりやすいという風に思うこことする。
結論は、シードとは違った結果になりやすいので、すべて試すのがいい。
印象としては
ガールは、口半開きなりやすい。逆三角形の口とか
あと、顔が丸い赤ちゃん顔になる。
いく もっとみる
図を書けるMermaidを始める時に最初に覚えること(end使えません)
```mermaidgraph LR; D[end]-->A A[全部小文字は使えません]--> B; A--> Z; B[代案]-->End; B-->END;B-->eNd;B-->enD;Z[どうしても使いたい] -->GG["endnode['end']"]```
小文字のendはなぜか使えない原因までは調べてません。
End,ENDとする、あるいは endnoc
StableDiffusioのUpscaleはシードで異なる。
どの程度、違うか、目と口元のアップで確認
好みのまつ毛や、唇のシワが出来るまで試してもいいかも
口パク本命のEMOが出るまでは、VideoRetalkingで遊ぼう!
Emoが本命デモを見る限り、アリババのEMOが口パク/LipSync動画としては、ものすごい品質だ。
https://humanaigc.github.io/emote-portrait-alive/
SadTalkerの後継 のVideoRetalkinghttps://github.com/OpenTalker/video-retalking
SadTalkerは静止画から口パクですが、Vi
サムネだけでわかる、Video-Retalkingの出力の改善例
Video-Retalkingの出力結果を画像にして、すべて弱めに、StableDiffusionするだけでも大きく改善されます。さらに、元の口元をコピーしたり、Enhance Upscaleしたりすると、プロダクションレベルにまで品質が上がります。
Google BardのYoutube動画の要約がすごく便利(キャプション有り動画限定?)
朝起きたら、拡張が使えるようになりましたとBardが言ってたので、試してみたらとても便利でした。
気になるけど長くて放置していたの英語のHow to 視聴が楽になるよ。
ちなみに、Google AI StudioでGemini APIに聞いたら、うまく動かなかった。
出来ない理由に以下のようにですので、キャプション専用かも
見出しの画像はBing Image Creatorが作成しました。