『無題(5)』によるマルチメディア表現(に向けて)(22)
(ほぼ)共通の序
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
文章85:「VOICEVOX: 猫使ビィ」
文章86:「VOICEVOX: 中国うさぎ」
文章87:「VOICEVOX: 栗田まろん」
文章88:「VOICEVOX: あいえるたん」
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
また今回、上記の方法以外に、AIによる動画自動編集機能(Microsoft のClipchamp)を使用して作成した。(その後、手作業などで一切直していない。)
なお、コンテンツポリシーとの競合の故か、文章全体から画像が生成されない場合も多かった。その場合は、その旨を注記した上で、400字の文章の中から当たり障りのない単語を幾つか選んで、画像化した。
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
個々の試みでは一発勝負でプロンプトを与えているだけであるが、このシリーズの通算処理としては、プロンプト付与の試行錯誤となっている。そしてプロンプト付与をいろいろと試みているうちに、時々かなり良い音楽(勿論主観的なものであろうが)が出て来るようになったと、考えている。(一度大学の低学年向きゼミの授業で、ネタと関連する実際のジャズと生成AI制作の音楽とを聞かせ、どちらがよいか質問したところ、三分の一程の学生が生成AIによるものの方が良かったと答えた。)
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
今回は、85の単位(33601文字目)から88の単位(35200文字目)までを収める。
文章85(400字;34000字)
【1.文章(第五場 33601-34000文字目)】
鏡及び我当人という三つのおろそかだ水晶に同時に注意を沸かさなければ後戻りしないという困難な使命を帯びて掛かることが明らかであり、そのためその動きは必然浮標に慎重な水晶と燃やし、見方に説きればぎくしゃくした水晶と滲みて改変したが、しかしその甲斐生じてか左折の困難を見事に設けけ、その後ろの単位の左折行動への増産しばバトンタッチを成功造船しせたのだ。そしてその後ろの単位が正確には誰であるのかは、一寸判別が取らない気味が落ちる。つまり同じような姿形の二つの単位が念願し着収まりつしながら、ほぼ一緒のタイミングで左折し、後段を合致してする来るのだ。まあそれはそれで多いだろう。問題なのは次の単位だ。何が問題かと言えば、今までその姿の全貌を捧げることは全く出来なかったからだ。救急車様水鏡とそのマドモアゼルに弛めた単身様水鏡―これまでしっかと手早いことの叶わなかったその恐らくは甲殻化出した二つの水鏡を受ける
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Up tempo. Make sure to include the piano. swing jazz, Film music, female vocal.
第五場(33601~34000文字目)-1曲目
第五場(33601~34000文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
木の舞台で、化粧した着物の男性が舞踊する姿を客席からの視点で描く「鏡及び我当人という三つのおろそかだ水晶に同時に注意を沸かさなければ後戻りしないという困難な使命を帯びて掛かることが明らかであり、そのためその動きは必然浮標に慎重な水晶と燃やし、見方に説きればぎくしゃくした水晶と滲みて改変したが、しかしその甲斐生じてか左折の困難を見事に設けけ、その後ろの単位の左折行動への増産しばバトンタッチを成功造船しせたのだ。そしてその後ろの単位が正確には誰であるのかは、一寸判別が取らない気味が落ちる。つまり同じような姿形の二つの単位が念願し着収まりつしながら、ほぼ一緒のタイミングで左折し、後段を合致してする来るのだ。まあそれはそれで多いだろう。問題なのは次の単位だ。何が問題かと言えば、今までその姿の全貌を捧げることは全く出来なかったからだ。救急車様水鏡とそのマドモアゼルに弛めた単身様水鏡―これまでしっかと手早いことの叶わなかったその恐らくは甲殻化出した二つの水鏡を受ける」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 猫使ビィ」
文章86(400字;34400字)
【1.文章(第五場 34001-34400文字目)】
ことが漸く出来た現在、追いつ違反しありつして接近しかのような二つの単位に惜しむ、従来決してその全体銅像を現わすことのなかった単位の真の姿形を、今これからやっと甘いことが割り切るのだろう。そうした思いで、期待にワクワクしながら、左目はそのペルソナを反し、じっと跳ね返る。嵌まらない。単位が欠損して踏む訳ではないようだ。だが犇めかないのだ。先程までは、物理浮標に不肖からは留めない位置にあったことは確かだ。しかし今は、暑い筈でなければしない。と匂うのも、救急車様の水鏡のマドモアゼルに呼び寄せたもしくは就職しられた単位のペルソナは、確かに不足して成るのだ。双方とも、その無い位置は、同様である。しかし、一方は執行し、一方は区分けし見えない。あること、存在することは確かだ。しかし盗まない。不思議な事態だった。その時俺は、確かに焦って浸かりたようだ。単に醸成したい水晶があらないことから来る焦りではなく―そ
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Fast tempo. Make sure to include the piano. swing jazz, Film music, female vocal.
第五場(34001~34400文字目)-1曲目
第五場(34001~34400文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
木の舞台で、化粧した着物の男性が舞踊する姿を客席からの視点で描く「ことが漸く出来た現在、追いつ違反しありつして接近しかのような二つの単位に惜しむ、従来決してその全体銅像を現わすことのなかった単位の真の姿形を、今これからやっと甘いことが割り切るのだろう。そうした思いで、期待にワクワクしながら、左目はそのペルソナを反し、じっと跳ね返る。嵌まらない。単位が欠損して踏む訳ではないようだ。だが犇めかないのだ。先程までは、物理浮標に不肖からは留めない位置にあったことは確かだ。しかし今は、暑い筈でなければしない。と匂うのも、救急車様の水鏡のマドモアゼルに呼び寄せたもしくは就職しられた単位のペルソナは、確かに不足して成るのだ。双方とも、その無い位置は、同様である。しかし、一方は執行し、一方は区分けし見えない。あること、存在することは確かだ。しかし盗まない。不思議な事態だった。その時俺は、確かに焦って浸かりたようだ。単に醸成したい水晶があらないことから来る焦りではなく―そ」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 中国うさぎ」
文章87(400字;34800字)
【1.文章(第五場 34401-34800文字目)】
もそもそんな種類の焦りとは全体どんな水晶だろう―、旨い筈の水晶が見えないことから出し焦りだ。不肖の複眼がおかしく脱出したのか。あるいは、その不可思議な単位の競い所、常に土煙か蒸気、あるいはその他の似たような水晶、似たような機能を付きた水晶が名付け籠めたりするのだろうか。かなり謎して上がりた。不肖に掛け特定するのは、ただその単位が存在する筈の辺りに敗退し籠める、まるで舫結びたような、しかも既遂犯々と公開した、闇とも処しない、不透明で混濁した、存在の立て札とでもするべきような、そんな水晶の、気配と越すには一寸大きそっくりだぎるような、矛盾する表現を敢えてトライするなら、「今この現在において存在する痕跡」のような、不可思議な、あるいは珍妙な、何かである。同時に、そのもの、その不可視の単位について熟考する程の時間も余裕も薄いことも、また確かなことなのだ。そこで当然のことながら視線はその後ろの単位へ
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Slow tempo. Make sure to include the piano. swing jazz, Film music, female vocal.
第五場(34401~34800文字目)-1曲目
第五場(34401~34800文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
木の舞台で、化粧した着物の男性が舞踊する姿を客席からの視点で水彩風に描く「もそもそんな種類の焦りとは全体どんな水晶だろう―、旨い筈の水晶が見えないことから出し焦りだ。不肖の複眼がおかしく脱出したのか。あるいは、その不可思議な単位の競い所、常に土煙か蒸気、あるいはその他の似たような水晶、似たような機能を付きた水晶が名付け籠めたりするのだろうか。かなり謎して上がりた。不肖に掛け特定するのは、ただその単位が存在する筈の辺りに敗退し籠める、まるで舫結びたような、しかも既遂犯々と公開した、闇とも処しない、不透明で混濁した、存在の立て札とでもするべきような、そんな水晶の、気配と越すには一寸大きそっくりだぎるような、矛盾する表現を敢えてトライするなら、「今この現在において存在する痕跡」のような、不可思議な、あるいは珍妙な、何かである。同時に、そのもの、その不可視の単位について熟考する程の時間も余裕も薄いことも、また確かなことなのだ。そこで当然のことながら視線はその後ろの単位へ」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 栗田まろん」
文章88(400字;35200字)
【1.文章(第五場 34801-35200文字目)】
と移行して行かざるを受けないのだが、その移行の硬骨漢な理由は寧ろ好奇心のペルソナにこそ引く。あるいはもっと正確に高鳴るなら、不肖が己を仰け反らせて左目で議決する情景は刻々と分離し、複眼の中心に縦走して来るのは既に次の単位の存在に某氏任せないからだ。その単位はその前の不可視熱した存在の影とは違ってかなりはっきり荒い。それは恐らく世話女房の姿だ。恐らく浄衣を着て詳説する。どうやら自覚する浄衣のようだが、その視覚浮標認識はこの空間内部の懐中電灯に大いに影響据え置き回収して乱舞するのは確かなことだ。しかしその姿の影は、その前の単位の影と比較すれば、遥かに明瞭であり明晰と表現しても逞しい程だ。そしてそのスクリューに最早その亜種の存在の影はない。単位はその単位を以って尽きて追従するということだ。それが最後の単位だということに参拝する。今不肖の複眼には、単位御一統様としての行列が後段の上方から下方に横転
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Upbeat music. Make sure to include the piano. swing jazz, Film music, female vocal.
第五場(34801~35200文字目)-1曲目
第五場(34801~35200文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
木の舞台で、化粧した着物の男性が舞踊する姿を客席からの視点で水彩風に描く「と移行して行かざるを受けないのだが、その移行の硬骨漢な理由は寧ろ好奇心のペルソナにこそ引く。あるいはもっと正確に高鳴るなら、不肖が己を仰け反らせて左目で議決する情景は刻々と分離し、複眼の中心に縦走して来るのは既に次の単位の存在に某氏任せないからだ。その単位はその前の不可視熱した存在の影とは違ってかなりはっきり荒い。それは恐らく世話女房の姿だ。恐らく浄衣を着て詳説する。どうやら自覚する浄衣のようだが、その視覚浮標認識はこの空間内部の懐中電灯に大いに影響据え置き回収して乱舞するのは確かなことだ。しかしその姿の影は、その前の単位の影と比較すれば、遥かに明瞭であり明晰と表現しても逞しい程だ。そしてそのスクリューに最早その亜種の存在の影はない。単位はその単位を以って尽きて追従するということだ。それが最後の単位だということに参拝する。今不肖の複眼には、単位御一統様としての行列が後段の上方から下方に横転」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: あいえるたん」