見出し画像

作曲家がAIとどう付き合っていくか

2023年4月30日のポッドキャスト収録時点でのお話
※ 本記事は個人の意見です

はじめに

この記事は研エンの仲の第102回のポッドキャストで話すトピックの事前整理用の記事となります。内容が気になった方は是非ポッドキャストで聞いてみて下さい!

研エンの仲のOP・ED制作を振り返って

第100回〜の新OP・EDを制作させていただきました!

  • OP

    • ドライブおしゃれ感

    • オシャレなコード進行(みんな大好き、Trap of love進行/サマー☆マジック進行、もといJust the two of us進行)

  • ED

    • 寝る前に聞けるゆったり感で落ち着いたイメージ

打ち合わせ段階で、案出しをしながらラフデモを作りながら進められたのが楽しかった。

🔈ラフデモサンプル
本OP/EDが「G(短調)、B♭(長調)」に対し、ラフは全音上の「A(短調)、C(長調)」だった。少し可愛すぎたので調を下げて重心を下げた。

兼業作家としての暮らし

  • 作編曲家とSoftwareEngineer(フリーランス)との兼業

SoftwareEngineerとして

  • Webやアプリ等を作るお仕事

  • 主に委託案件(月当たりX時間働く)・請負案件(X日までに納品する)

※ SoftwareEngineerのお仕事は割愛

作編曲家として

  • 作曲・編曲って何?の話

  • 今のメイン仕事は、歌手の曲(歌モノ)やインストBGMを作るお仕事

  • わりと遅書きタイプ

■ 歌モノ制作(1コーラス)の時間配分
目標時間:20〜25h(作業目安:3〜5日)
・ラフ方針作り:1〜2h
・仮作詞・メロ作成:10〜15h
・編曲(アレンジ):5〜10h
・仕上げ作業(Mix):2h

■BGM制作の時間配分
目標時間:2〜7h(作業目安:0.5〜1日)

■時間配分の理想と現実
X時間でやるぞと思っても、かなりブレやすい性質が強め。

兼業作家のPros/Cons

  • Pros:良かったこと

    • 音楽機材を買うこと・楽曲制作費を躊躇せず出せる(現代の作曲活動は思っている以上にお金がかかる)

    • 過度な営業・やりたくない仕事はしない選択が取れる(ライフワーク&ライスワーク理論な話)

    • テレワーク x 作曲活動の相性は◎

  • Cons:悪かったこと

    • 初めの2〜3年は両方うまく回らず苦戦した

    • 時間の無い中でワークライフバランスを維持するための取捨選択を迫られる

      • 取:お金に困らないこと・作編曲活動の継続

      • 捨:演奏家業(プレイヤー)・SNS活動(ブランディング)は今はやっていない

    • 両方の仕事がタイミング悪く忙しくなると辛くなる

    • 作業切り替えとメンタルコントロールが難しい

兼業作家は続けるのか?

現時点では作編曲のお仕事で生活水準的に余裕を持てるならシフトしようとは思っている。ただ、どういう未来が自分にとってベストなカタチかは、ライフステージの変化等で今後も変わってくはずなので柔軟に対応していきたい。

兼業作家だからこそAIをうまく活用したい

兼業作家(に限った話ではないが)は時間が足りない中でやりくりするため猫の手も借りたいことが多い。AIとうまく共存できる道を探りたい。

AI作曲の最近

多くのAI作曲ツールが台頭している。従来型なタイプから、膨大なデータから学習したものまで、多くのツールが存在している。それぞれ沢山あるうちのいくつかをピックアップする。

  • 従来型(教師データの次元を落とした形の学習系?)のAI生成:品質は担保されやすい印象。

  • 大規模言語モデル・拡散モデル型のAI生成:良くも悪くも品質は上ブレも下ブレもする印象。

  • 大規模言語モデルを活用した音楽制作ツール:作業が便利になると嬉しい。

    • WAVTOOL

      • GPT4を介し操作できるDAW

MusicLM

テキスト記述から音楽を生成するモデル。
(2023/5 追記:最近自分で生成できるようになったみたいです)

MusicLMは、「歪んだギターリフに支えられた落ち着いたバイオリンのメロディ」というようなテキスト記述から、忠実度の高い音楽を生成するモデルであることを紹介する。MusicLMは、条件付き音楽生成のプロセスを階層的なシーケンスからシーケンスへのモデリングタスクとして投げかけ、数分間に渡って一貫性を保つ24kHzの音楽を生成する。我々の実験によると、MusicLMは音質とテキスト記述への忠実さの両方において、以前のシステムを凌駕しています。さらに、MusicLMはテキストとメロディの両方を条件とすることができ、テキストのキャプションに記述されたスタイルに従って口笛や鼻歌のメロディを変換できることを実証しています。今後の研究を支援するため、我々は、人間の専門家によって提供された豊富なテキスト説明を持つ、5.5kの音楽とテキストのペアからなるデータセット、MusicCapsを一般に公開しています。

https://google-research.github.io/seanet/musiclm/examples/

Audio Generation From Rich Captions

🔈3番目を引用

A rising synth is playing an arpeggio with a lot of reverb. It is backed by pads, sub bass line and soft drums. This song is full of synth sounds creating a soothing and adventurous atmosphere. It may be playing at a festival during two songs for a buildup.
立ち上がるシンセが、リバーブを多用したアルペジオを奏でています。それをバックに、パッド、サブベースライン、ソフトドラムが鳴り響きます。この曲は、シンセの音で、癒しと冒険の雰囲気を作り出しています。フェスで2曲の間に演奏して盛り上げるのもありかもしれません。

Text and Melody Conditioning

メロディプロンプトを加えることで、提供されたメロディに沿いながら、テキストプロンプトを尊重した音楽を生成することができる。

🔈「bella ciao - humming」の「tribal drums and flute」から曲を引用。

Story Mode

一連のテキストプロンプトを提供することで生成され、場面を提示することで、曲の展開を生成してくれる。

概要のみ引用。

Riffusion

拡散モデルをスペクトログラムに適用したサービス。

🔈試しに生成したLo-fi曲

Bark

Transformer(GPT系)。多言語音声のほか、音楽、バックグラウンドノイズ、簡単な効果音などの音声を生成することが可能。笑いやため息、泣き声などの非言語コミュニケーションも生成することができるのが特徴。

🔈引用1つめ:研エンの仲の歌
🔈引用2つめ:研エンの仲の謎ジングル(生成中に歌ではないものができたもの)

(おまけ)Synthesizer V

初音ミクには無かった、リアルっぽさを追求できるボカロという感じ。結構最近の技術は凄いので是非聴いてほしい(聞き分け出来ないレベル)。


AI作曲の恩恵

  • 作業効率向上

  • アイデア出し

  • 新規アイデアと既存作品との類似性算出

  • 作詞作業の補助(with ChatGPT?)

AI作曲が破壊するもの

  • 著作権周り

  • ブランド価値

さいごに:宣伝

近頃のお仕事宣伝など

https://lit.link/yusekizawa

■「ミライスカート⁺ 」さん
”メトロポリタン”(作曲)
物販・オンラインストアなどから

■「Runaar」さん
”好きって最強。” (作編曲)
Youtube・タワーレコード販売・各種配信サービスから

■「ムーミンバレーパーク(埼玉県飯能市)」でのショーの曲
”マンハッタンダイナマイト” (作曲)
エンマの劇場の「自由でしあわせな生活」、「ダンス・ダンス・ウィズ・ムーミン(回による)」にて観覧可能(2023/5現在)

その他依頼など

音楽絡みの、お仕事依頼などあれば、お気軽にTwitterDMやメール等ご相談下さい!https://twitter.com/yusekizawa


この記事が気に入ったらサポートをしてみませんか?