見出し画像

Jukebox

設定ガイド:

your_lyrics:ジュークボックスが従おうとする歌詞を指定します。ここに好きな歌詞を貼り付けるか、空白のままにしておくと、ぎこちない結果になります。

モデル:
OpenAIは、ジュークボックス用にいくつかの異なるモデルをトレーニングしました。このノートブックでは、5b_lyricsモデルと1b_lyricsモデルにアクセスできます。ご想像のとおり、5b_lyricsモデルは優れたモデルですが、正しく実行するにはより強力なGPUも必要です。どのモデルを選択するかは、割り当てられたGPUによって異なります。これは、ノートブックの最初のセルで確認できます。推奨設定:P100またはT4 GPUでは5b_lyrics、K80GPUでは1b_lyrics。
(5b_lyricsは理論的にはK80で動作しますが、サンプリングは非常に遅くなります。)

hps.n_samples:
ここで、生成するサンプルの数を選択できます。GPUが異なれば、サンプルの量も異なります。推奨設定:
P100 GPU:3サンプル、
T4 GPU:2サンプル。
K80 GPU:最大8サンプル、ただし1b_lyricsのみ。

hps.name:結果が表示されるGoogleドライブ内のフォルダーの名前を指定します。実行ごとに異なる名前を選択してください。そうしないと、ノートブックが混乱します。

speed_upsampling:選択すると、サンプルがわずかに「途切れ途切れ」に聞こえるという犠牲を払って、はるかに高速にアップサンプリングします。

モード:使用可能なモードはプライムされ、祖先です。Primedは既存の曲を継続し、祖先は最初から曲を生成します。(提供されたフォルダ内でデータファイルが検出された場合、アップサンプルモードが自動的に選択されます)

audio_file:プライムモードにのみ必要です。ジュークボックスが続行する曲を指定します。必要なファイル(.wav形式である必要があります!)をGoogleドライブのルートディレクトリにアップロードし、その名前を上に入力します。

prompt_length_in_seconds:プライムモードにのみ必要です。ファイルのジュークボックスがプライミングされる秒数を指定します(したがって、その時点でジュークボックスは「キックイン」します)。メモリ上の理由から、24秒未満に保つことをお勧めします。

sample_length_in_seconds:完全に生成されたサンプルの長さを指定します。

select_artistとselect_genre:利用可能なアーティストとジャンルのリストはここにあります:https://github.com/openai/jukebox/tree/master/jukebox/data/ids
5b_lyricsモデルはv2リストを利用し、1b_lyricsモデルはv3リストを利用します。「ヒップホップポップパンクディスコ」など、最大5つのv2ジャンルを組み合わせることができます。v3のジャンルを組み合わせることはできません。

サンプリング温度:ジュークボックスの創造性とエネルギーを決定します。温度が高いほど、結果はより混沌とし、強烈になります。これを試すことができます。.96〜.999の間に保つことをお勧めします

重要なリンク:

公式ブログ:https://openai.com/blog/jukebox/
元のリポジトリ:https://github.com/openai/jukebox/

ライセンス:非営利、詳細については、https://github.com/openai/jukebox/blob/master/LICENSEを参照してください。

Guide to the above settings:

your_lyrics: Specify the lyrics Jukebox should attempt to follow. You can paste any lyrics you want in here or leave it blank, which will result in gibberish.

model:
OpenAI has trained a few different models for Jukebox. In this notebook, you can access the 5b_lyrics and 1b_lyrics models. As you can imagine, the 5b_lyrics model is the superior one, but also requires a stronger GPU to run properly. Which model you should choose depends on the GPU you were assigned, which you can check in the first cell of the notebook. Recommended settings: 5b_lyrics on P100 or T4 GPU, 1b_lyrics on K80 GPU.
(5b_lyrics theoretically works on a K80 now, but sampling is going to be super slow.)

hps.n_samples:
Here you can choose how many samples you want to generate. Different GPUs can handle a different amount of samples. Recommended settings:
P100 GPU: 3 samples,
T4 GPU: 2 samples;
K80 GPU: up to 8 samples, but 1b_lyrics only.

hps.name: Specifies the name of the folder in Google Drive, where you will find your results in. Make sure to choose a different name for each of your runs, or else the notebook will get confused.

speed_upsampling: If selected, will upsample much faster, at the cost of the samples sounding slightly "choppy".

mode: Available modes are primed and ancestral. Primed will continue an already existing song, ancestral generates a song from scratch. (Upsample mode will be selected automatically if a data file is detected within the folder provided)

audio_file: Only needed for primed mode. Specifies which song Jukebox will continue. Upload the file you want (needs to be .wav format!) to the root directory of your Google Drive and fill in its name above.

prompt_length_in_seconds: Only needed for primed mode. Specifies how many seconds of your file Jukebox will be primed on (so, at which point Jukebox will "kick in"). Recommended to keep below 24 seconds for memory reasons.

sample_length_in_seconds: Specifies how long your fully generated samples are going to be.

select_artist and select_genre: List of available artists and genres can be found here: https://github.com/openai/jukebox/tree/master/jukebox/data/ids
The 5b_lyrics model utilizes the v2 lists, the 1b_lyrics model the v3 lists. It is possible to combine up to five v2 genres, for example "Hip Hop Pop Punk Disco". Combining v3 genres is not possible.

sampling_temperature: Determines the creativity and energy of Jukebox. The higher the temperature, the more chaotic and intense the result will be. You can experiment with this. Recommended to keep between .96 and .999

Important links:

Official blog: https://openai.com/blog/jukebox/
Original repo: https://github.com/openai/jukebox/

License: Non-commercial, for details see: https://github.com/openai/jukebox/blob/master/LICENSE

この記事が気に入ったらサポートをしてみませんか?