Google Colab で AudioLDM による音楽生成を試す
Google Colab で「AudioLDM」による音楽生成を試したのでまとめました。
1. AudioLDM
「AudioLDM」は、テキストからサウンドエフェクト、人間の音声、音楽を生成するAIモデルです。
2. Colabでの実行
Google Colabでのセットアップの手順は、次のとおりです。
(1) 新規のColabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」を選択。
(2) パッケージのインストール。
# パッケージのインストール
!git clone https://github.com/haoheliu/AudioLDM.git
%cd AudioLDM
!pip install -e .
(3) ウェイトのダウンロード。
# ウェイトのダウンロード
!mkdir ckpt
!wget https://zenodo.org/record/7600541/files/audioldm-s-full?download=1 -O ckpt/audioldm-s-full.ckpt
(4) 推論の実行。
サウンドエフェクトを生成します。
# 推論の実行
!python scripts/text2sound.py -t "2 cats are fighting"
左端のフォルダアイコンのファイル一覧の「AudioLDM/output」からwavファイルをダウンロードできます。
text2sound.pyのパラメータは、次のとおりです。
(5) 推論の実行。
音楽を生成します。
# 推論の実行
!python scripts/text2sound.py -t "music made by 8bit NES"
この記事が気に入ったらサポートをしてみませんか?