うちのデジタル便り

本

わたしたちの日々の小さなデジタル技術活用をメモしたものです。紆余曲折したりもしてるけれど、わたしたちは元気です。［想定読者］デジタル技術を業務やサービス開発などに活用される方

運営しているクリエイター: まなび梯

#GoogleColab

Google Colabで動かすSadTalker

Google Colab上でSadTalkerを動かしました。公式のデモコードを少しいじって、自分のファイルを指定しやすくしたものです。 ▍SadTalkerとはSadTalkerは音声と画像をもとに口パク（リップシンク）の動画をつくる仕組みです。絵や写真に写っている人が音声に合わせて話している風の映像を作れるということです。人間を動画で撮影しなくて済めば、収録がはかどりそうです。素晴らしい！次の動画は実際に作ってみたサンプルです。音声はVoicepeakで出力し、画像

5行で音声テキスト化｜Google Colabで動かすWhisper

OpenAIから公開された音声テキスト化モデル「Whisper」を、Google Colabで動かします。シンプルなやり方であれば、ライブラリのインストールを含めても5行で実行できます。楽ですね！とりあえず動かしたい方向けですので、より詳しい使い方を知りたい方は公式や他の記事をご参照くださいませ。 ▍事前準備Google Colabの環境準備を準備します。 1️⃣ ランタイムのタイプをGPUに変更 [ランタイム] → [ランタイムのタイプを変更]から、[ハードウェアア

Stable Diffusionでプロンプトとシードを画像に出力｜Google Colab

Stable Diffusionで出力する画像にプロンプト（呪文）とシード（乱数）も加え、Googleドライブに保存するお話です。環境はGoogle Colabです。 ▍ことの背景ちょっとしたイラストはStable Diffusionでまかなってしまおうと、呪文詠唱を練習中です。同じ呪文でも画像が異なることも多く、「さっきの画像をベースに調整したい」なんてことがあります。そんなときには、「さっきの画像」と同じシード（乱数）を指定します。呪文と乱数を保存しておけば再現でき

うちのデジタル便り

フォローしませんか？

#GoogleColab

Google Colabで動かすSadTalker

5行で音声テキスト化｜Google Colabで動かすWhisper

Stable Diffusionでプロンプトとシードを画像に出力｜Google Colab