見出し画像

漫才を題材に、台本作成から自然な演技指導・録音まで全部AIにまかせてみた

AIに丸投げでコンテンツを考えてもらうシリーズです。
今回は漫才を題材に、台本作りから本番の音声までAIにお願いしてみます。
台本作成はGPT-4先生、演技指導はBark先生です。

人間は手を加えず正確にコピペするのが仕事です。キリッ

台本をつくる

ChatGPT(GPT-4)先生に台本作りをお願いする。


花子さんと太郎さんの掛け合い漫才のシナリオを生成してください。
以下のフォーマットでお願いします。

花子: どーも、花子でーす。

太郎: 太郎でーす。

花子: 

太郎:

(繰り返し)

花子: なんでやねん! ありがとうございました。

花子: ども、花子でーす。

太郎: 太郎でーす。

花子: ねえ太郎さん、最近スマホばっかりいじってるよね。

太郎: うん、便利だからさ。どうして?

花子: いや、便利なのはいいけど、スマホばかりで目が悪くならない?

太郎: 大丈夫、俺はもともと目が悪いから!

花子: ボケてる場合じゃないわよ!

太郎: だってさ、これがないと道に迷うじゃん。

花子: でもさ、昔は地図を使ってたでしょ?

太郎: そうだね。でも、スマホで地図を見るほうが簡単だよ。

花子: 確かにそうだけど、たまには目を休めた方がいいと思うんだ。

太郎: じゃあ、どうやって休めばいいの?

花子: たまには景色を見ながら散歩するとか、本を読むとか?

太郎: 本を読むって、それも目を使うじゃん!

花子: そうだけど、せめてスマホから離れる時間を作るってことよ。

太郎: わかったよ。じゃあ、散歩に行くか。

花子: いいね!どこに行く?

太郎: えーと、スマホで地図を見て決めるね!

花子: なんでやねん! ありがとうございました。

録音する

高名なGPT4先生の作品ですので面白いかはさておき、そのままの台本でBark先生🐶に音入れをお願いします。

import os
import numpy as np

os.environ["CUDA_VISIBLE_DEVICES"] = "0"
from IPython.display import Audio

from bark.generation import (
    generate_text_semantic,
    preload_models,
)

from bark.api import semantic_to_waveform
from bark import generate_audio, SAMPLE_RATE
GEN_TEMP = 0.8
silence = np.zeros(int(0.2 * SAMPLE_RATE)) 
pieces = []

speaker_lookup = {"花子": "v2/ja_speaker_8", "太郎": "v2/ja_speaker_6"}

for line in script:
    speaker, text = line.split(": ")
    semantic_tokens = generate_text_semantic(
        text,
        history_prompt=speaker_lookup[speaker],
        temp=GEN_TEMP,
        min_eos_p=0.05,  # this controls how likely the generation is to end
    )

    audio_array = semantic_to_waveform(semantic_tokens, history_prompt=speaker_lookup[speaker],)
    pieces += [audio_array, silence.copy()]

Audio(np.concatenate(pieces), rate=SAMPLE_RATE)

2m2.7s

完成!(mp3ファイル)

ちょっとテンポがゆっくりな感じだったので、10%だけ再生速度をあげてみました。


おしまい。ありがとうございました

関連記事


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?