漫才を題材に、台本作成から自然な演技指導・録音まで全部AIにまかせてみた
AIに丸投げでコンテンツを考えてもらうシリーズです。
今回は漫才を題材に、台本作りから本番の音声までAIにお願いしてみます。
台本作成はGPT-4先生、演技指導はBark先生です。
人間は手を加えず正確にコピペするのが仕事です。キリッ
台本をつくる
ChatGPT(GPT-4)先生に台本作りをお願いする。
花子さんと太郎さんの掛け合い漫才のシナリオを生成してください。
以下のフォーマットでお願いします。
花子: どーも、花子でーす。
太郎: 太郎でーす。
花子:
太郎:
(繰り返し)
花子: なんでやねん! ありがとうございました。
録音する
高名なGPT4先生の作品ですので面白いかはさておき、そのままの台本でBark先生🐶に音入れをお願いします。
import os
import numpy as np
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
from IPython.display import Audio
from bark.generation import (
generate_text_semantic,
preload_models,
)
from bark.api import semantic_to_waveform
from bark import generate_audio, SAMPLE_RATE
GEN_TEMP = 0.8
silence = np.zeros(int(0.2 * SAMPLE_RATE))
pieces = []
speaker_lookup = {"花子": "v2/ja_speaker_8", "太郎": "v2/ja_speaker_6"}
for line in script:
speaker, text = line.split(": ")
semantic_tokens = generate_text_semantic(
text,
history_prompt=speaker_lookup[speaker],
temp=GEN_TEMP,
min_eos_p=0.05, # this controls how likely the generation is to end
)
audio_array = semantic_to_waveform(semantic_tokens, history_prompt=speaker_lookup[speaker],)
pieces += [audio_array, silence.copy()]
Audio(np.concatenate(pieces), rate=SAMPLE_RATE)
完成!(mp3ファイル)
ちょっとテンポがゆっくりな感じだったので、10%だけ再生速度をあげてみました。
おしまい。ありがとうございました
関連記事
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?