見出し画像

ついに初志貫徹の境地に。33 年前の自作曲「次の世界のアダムとイヴ」に全シーンAI 動画の適用を。

去年の夏に、慢性疾患での月1 定期通院の待合室でうつされた酷い
夏風邪(全く本末転倒な理不尽でした)で11 日間のダウンと自主的に
自室隔離した間に、AI 描画の沼に墜ちたのでしたが、その時の
初志に半年かかってようやく到達しました。

そこに記した内容です。

> 風邪での不調下では、精神的にも体力的にも新作を模索することは
> 到底無理なので、そういう時には旧作品への動画制作に取り掛かることに> していましたが、それも進みません。その停滞する要因(気分のムラや
> 怠慢という根本問題以外で)も並行で考察を進めました。

> 大きな要因として、特に私の作詞面での映像想起性が動画選定に対して
> 厄介なハードルとなっているという漠然とした想いが確信に変わり
> ました。

> 歌詞の背景にただ単調な風景などの動画は似合わないため、
> それに合ったフリー動画を探すも、かなり容易ではないということが
> あります。

https://pixabay.com/ja/

PixaBay などのフリー動画提供サイトから、楽曲場面に合う動画を入手
して、それで自身の過去の楽曲を動画化することに無理がある、という
局面に対して、静止画のスライドショーレベルでも良いから歌詞に
フィットした情景を自前で用意出来れば、どれだけ素晴らしいことか、
という想いが、この半年のAI 描画の七転八倒、猪突猛進の根底に
あったのでした。(かつての楽曲制作の複数のご縁は私のAI 描画への
没頭で「作曲創作の道は捨てたのか」と解釈されたのか、やや縁遠くも
なりましたが…。)

ようやくそれが実現の領域に及びました。

先日の suno.ai による自動作曲の記事で、

> 作曲制作の再開もブログで宣言したところでしたが、
> この衝撃は孤独で単調な作曲制作の世界にぐいっと引き戻される
> トリガーになりそうです。

と記しましたが、作曲制作への回帰は既定路線というか、作曲制作
を自身で強く支えるための、AI 描画に没頭の半年だったのでした。

回帰の方向に収束するだけではなく、この半年で定番化した
SF 画を纏めてストーリー仕立てにするなどの画の公開スタイルも、
機会を見ながら続けて行こうと思います。
それがまた新たな着想を呼ぶだろうと考えます。

それでは作品です。
1991 年作詞曲・制作の「次の世界のアダムとイヴ」。
全シーンをAI 描画で制作しました。

今から約33 年前、曲を着想して1 人多重録音でオケを完成
させた後、その音響を聴きながら、自由形式の俳句(祖父が
正岡子規の孫弟子にあたり、関西俳壇では大きな同人活動の主催
でした。俳名は亀田小蛄。有難いことに大学での研究対象として
扱って頂いているとのこと。私はそれを成人してから知り、直接の
薫陶を得たことはなし。)のように旋律に言葉を置いて行った
その過程で頭にあった映像を、ほぼ完全に第三者にも伝えられる
仕上がりとなりました。
フリー動画素材の寄せ集めでは絶対に到達しない境地です。

この楽曲は2001 年にもリアル・ユニット(3 人編成。ライブ活動無し・
録音制作のみ。2001 年 ~ 2005 年。)活動で再編曲と制作をしました
ので、そちらの版でもシーン転換や歌詞テロップのタイミングを
調整したものを仕上げました。

AI 描画の技術習得の後、何を描こうかと模索されて、果ては
ChatGPT に描画テーマまで投げられる事例も拝見しますが、私は
その点には困りません。膨大な過去の公開・非公開の自作曲が
あるからです。

楽曲解説(歌詞の公開を含む)はこちら。
この古い自サイト記事は、今回の動画化が決して後付けのアイデア
でなく、当時、実現不能ながら着想として存在した証拠でもあります。

そして過去に自作曲に対して「聴く映画」と称して来たのが
ついに「見ることの出来る映画と音楽」となったのでした。
ようやくこの半年のAI 描画への没頭とこれまで半世紀にわたる
ライフワークである作曲制作の推進軸が1つに纏まりました。

「動画化の興味に邁進しても、監督・脚本・セリフ録音など
多重の役割までさらに背負うのか?そうして映像作品の予告編
程度のものを作れば満足なのか?」という命題に対する私なりの
(=私限定の)解決でもありました。


今回の動画作成でのおおよその工程は以下の通りです。
特にマニアックな裏技などはありませんが、この工程が最も
鑑賞になじむ現時点でのベストではないかと考えます。
またこの工程なら、GPU 搭載のないノートPC でも同じことが
ほぼ出来ることを確認しましたので、(補記)に併せて記載
しました。

1.動画の元になる静止画の生成

先日 AUTO1111 版から完全移行を済ませた Stable Diffusion Web UI Forge
に歌詞の2 行程度ずつ、DeepL 翻訳サイトで英訳したものをプロンプト
にして与えるも、大抵は意図から外れる(歌詞冒頭では大花火大会の
画が続出しました^^;)ので、その英文を自力で補正を重ねて、
1 回の「Generate」で12 画の出力をさせる設定でCheckPoint ファイル
を変更しながら5 回ほど繰り返して、その中から意図に近い画を2 - 3 画
ほどを選ぶことを歌詞の全行に対して順次実施する。

2.静止画からの簡易動画作成

そのようにして揃えた静止画をLeonard.Ai で1 日あたり、25 画の
Image to Image 処理(トークンを1 だけ使うCheckPoint 設定で)
での取り込みと、その中からImage to Motion 処理での4 秒の動画
(25 トークン必要)を5 つ作成して、無償利用の150 トークン / 日
を使い果たすので、また続きを次の日に実施。

3.動画の長秒化

工程2.を繰り返して必要な4 秒動画を揃えたら、それらを
PC にダウンロード入手して、Windows10/11 の「フォトレガシ」
を使って、「その他を編集」⇒「スローモーションの追加」⇒
(中間設定の)「さらにスロー」を全領域にかけて7 秒強の動画を
作成して揃える。
シーンによってはさらにその操作を繰り返して16 秒動画を作成
する。(動きがほぼ止まってしまう動画には適用しない。
Runway での無償16 秒延長生成より、歪曲変形も発生しない。)

4.動画と自作曲 mp3 の 編集

手持ちの中では現時点で使い勝手に最も慣れている Android
タブレット上の VLLO に動画素材を移して、工程3.の動画素材と
自作曲 mp3 のタイミングを編集・調整する。
(処理の頭に広告を見る必要があるものの、生成される動画には
無償利用でも透かしが入らない優れものです。)
16 秒の動画素材があるので、それを適切な長さにカットする
ことで、歌詞のフレージングとシーン転換のタイミングを調整し易く
4 秒ごとに場面がバタバタと切り替わる落ち着きの無さを解消出来ます。

(補記)
工程1.はTensol.Art で膨大なCheckPoint ファイルの中から
Vigee-Cyber_Realistic-v2.0 などを使って描画させることでも
代用出来、その場合は工程2.や工程3.と同様に
Geforce RTX 系のGPU 搭載の無い普通のWindows 10/11 ノート
PC でも実現が可能です。

工程4.もWindows 10/11 の ClipChamp やフォトレガシを
使う(無ければ無償ダウンロード可)ことで、VLLO は必須では
ありません。

今回は前回の自作曲動画化から統一した公開形式に沿うように、
前回使用したプロジェクトファイルを再利用するため、VLLO を
使いました。

ついでながら….。
公開形式統一前の自作曲動画化記事も改めて宜しくお願いします。





ご覧いただきありがとうございます。
 




この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?