『無題(5)』によるマルチメディア表現(に向けて)(27)
(ほぼ)共通の序
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
文章105:「VOICEVOX: No.7」
文章106:「VOICEVOX: ちび式じい」
文章107:「VOICEVOX: 櫻歌ミコ」
文章108:「VOICEVOX: 小夜/SAYO」
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
なお、コンテンツポリシーとの競合の故か、文章全体から画像が生成されない場合も多かった。その場合は、その旨を注記した上で、400字の文章の中から当たり障りのない単語を幾つか選んで、画像化した。
使用した画像生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
今回は、33の単位(12801文字目)から36の単位(14400文字目)までを収める。
文章105(400字;42000字)
【1.文章(第五場 41601-42000文字目)】
の男達のそのこちとら、あれ何時の間にとさっきからそこに後ろ向きに転がして測量する、悪い色調が防音した黄色のビキニスタイルのような腸詰めで肩口の辺りを広げ揃えた、二手合いの手合いらしい家だにまたはシュリンプの、そのまた前にちょこなんと、解剖してしまいお二手合いの、その家だにまたはシュリンプ、恐らく誰かさんであるらしいいや婿であるらしい誰かさん達は、する中裁ちのその手合いの孤に向き直り、上腕を過小評価して通しせっせと、何やら衣裳を蔓延したり、特にその手合いの月代に何かのよいとまけや賂をしたり、しているかの如くに見えにけり。右側の婿の頬っぺたがまっ告知しけなのが奇妙に瞳に悪い、その間であった。するとすっくと付ける、その手合いは。後ろ向きに。手頃な手毬よろしく揚げ上げられた俺等のあちきが上昇し、頂点に興りた時にねだか地面に座相殺して撤廃したらしいその手合いの、塗る上向き移動は、アチキうちの下降速度
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:
「次の文章から音楽生成AIで用いるプロンプトを、英語で作成したいです。」に、【1.文章(第五場 41601-42000文字目)】を加えてChatGPTに入力した。さらに、「文字数を200文字以下に縮めてください。」と入力し、以下のプロンプトを生成させた。
Generate a surreal, eerie soundscape with dissonant tones and fluctuating rhythms. Capture tension, mystery, and sudden shifts in dynamics, evoking fragmented, dream-like imagery.
第五場(41601~42000文字目)-1曲目
第五場(41601~42000文字目)-2曲目
【3.文章からの画像生成(一枚)】
「次の文章から画像生成AIで用いるプロンプトを作成したいです。」に、【1.文章(第五場 41601-42000文字目)】を加えてChatGPTに入力した。その後、生成された文章の頭に「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。」を加えたものをプロンプトとした。
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。夢の中のように奇妙なシーン。2人の男が家の前に立っていて、黄色の防音されたビキニスタイルの服を着ている。1人は後ろ向きで何かを測量し、もう1人はシュリンプのような生物を解剖している。家は不気味な雰囲気を放ち、暗い色調と歪んだ構造を持っている。もう1人の男(恐らく婿)は、頬が不思議な光を放ち、奇妙な表情を浮かべている。男たちは衣服を縫ったり、賄賂を渡しているように見え、彼らの腕は異常に細く小さく見える。背景では、何者かが手毬のように空中に投げ上げられ、頂点に達した後、地面に激しく落下してシーンが消えていく。全体に暗い雰囲気が漂い、上昇と下降の奇妙な動きが交錯し、不安感のある空がこの幻想的な光景を見守っている。
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: No.7」
文章106(400字;42400字)
【1.文章(第五場 42001-42400文字目)】
と調和して、あちらしば自分自身は保ち、自分自身共同開発しばあちらが引退する。落ち目の手合いと引き裂く手合い、これぞ誠の対称にして、こちとらドスンと地面に衝突、その時その手合い完全に、立ち上がり己を凍結し、これぞ誠に妙にして、決然とした姿也。今こそ俺等のアチキのうち、そしてあたいの妾めは、痛みよりも、掛けたい紛らせたいと固め念願する、肉弾球に片付き抗弁して、担ぎて掘りて護衛し移転して、遠慮会釈もなき様に、任せ成ら組織する覚悟にて、前の手合い、後ろの手合いにチョッカイ糖、潜めてやってお願いしますと、忘れ膿んで臭みを横転する、瞳玉でも、切に呼び掛け続けるや、今度は誰かさん次は後ろ手合いと、当たり当たりし申し送りして入れるので、お有難う御座いますだ、とオラは感謝に吊り下げ回らず、宙に参戦する度空醜い毎に、嬉し涙成りて集荷しはるか全焼し。その嬉し涙、その嬉し涙水沫の内湯に内湯に、その手合い、びっくり
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
「次の文章から音楽生成AIで用いるプロンプトを、200文字の英語で作成したいです。」に、【1.文章(第五場 42001-42400文字目)】を加えてChatGPTに入力した。さらに、「50文字程度に短縮してください。」と入力し、以下のプロンプトを生成させた。
プロンプト/Style of Music:Create an eerie soundscape with dark tones and fragmented rhythms, evoking mystery.
第五場(42001~42400文字目)-1曲目
第五場(42001~42400文字目)-2曲目
【3.文章からの画像生成(四枚)】
「次の文章から画像生成AIで用いるプロンプトを作成したいです。」に、【1.文章(第五場 42001-42400文字目)】を加えてChatGPTに入力した。その後、生成された文章の頭に「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。」を加えたものをプロンプトとした。
画像生成プロンプト:
「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。対称性と衝突のシーン。二人の人物が対峙し、一方が地面に衝突し、もう一方は冷静かつ決然と立ち上がり、凍りついたような姿勢を取っている。周囲には複雑な動きが交錯し、他の人物が痛みと迷いを抱きつつも、護衛や組織的な動きを伴って前進している。暗い空には何かを背負い宙を漂う人物が、涙をこぼしながら満ちていく。涙は水泡となって流れ、温泉のように湧き上がる。最後に、驚いた表情をした人物がその場に立ち尽くし、全体に不思議な喜びと痛みが入り混じった幻想的な雰囲気が漂っている。」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: ちび式じい」
文章107(400字;42800字)
【1.文章(第五場 42401-42800文字目)】
する程あっと言う間に、己を翻して前向きに、感嘆するなり目と瞳を客観的だ二手合い、うっとりとした時間也。えい、それにしても、打ちし見学しあり、さっさと燃やし立て突っ込ままい腸詰めか、何し施すのかこの人達、ワシの心が奪いあらないのか、それともこのワシに、心受胎する腸詰め旨いなどと、リビングキチンにし苦しみ立てるのでないか、焦り交わし不用意だ時間也。縮小し和やかだ。わいらの行列打ち引き上げる。し進め、二股と戻りウルトラリンケン強い、二股道を左折する。出発進行。いよいよ薄い一本道、姿勢減り、えいさ掛けさ、速度欺くぞ噴煙もぶら下げるぞ、どですかでんの電鉄の旅、懐かしささえ飛ぶ也。この一本道に進入すると漸く、思い切り掃き特配しらることがなくとも、その手合いの姿形やその周囲の様々な物や、ヒッコリーのような腸詰めに描か判明した線描画等を、掛かることが有用だように同情したので、嬉々としてやつがれは、郵便局井
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
「次の文章から音楽生成AIで用いるプロンプトを、200文字の英語で作成したいです。」に、【1.文章(第五場 42401-42800文字目)】を加えてChatGPTに入力した。さらに、「50文字程度に短縮してください。」と入力し、以下のプロンプトを生成させた。
プロンプト/Style of Music:Create a nostalgic, surreal soundscape with gentle rhythms and faint echoes, evoking a whimsical train journey.
第五場(42401~42800文字目)-1曲目
第五場(42401~42800文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。ノスタルジックで幻想的なシーン。人物が感嘆するように前を向き、彼の視線の先には夢のような情景が広がっている。うっとりとした表情を浮かべ、腸詰めが並ぶリビングキッチンで複雑な感情を抱き、見学者たちが立ち尽くす。細い一本道が延び、懐かしいどですかでんの電鉄が煙を上げながらゆっくりと進む。道の先に、ヒッコリーのような腸詰めが配置された線描画が施され、古い郵便局の前を行列が通過している。全体に柔らかく縮小された雰囲気が漂い、懐かしさや不安が入り混じる幻想的な旅の様子が描かれている。」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 櫻歌ミコ」
文章108(400字;43200字)
【1.文章(第五場 42801-43200文字目)】
戸車に操縦し分解して更迭する無性者の蒸気機関車や鋼索鉄道のようにではなく、ユアセルフの内に管球を作り出しあるいは管球を分かりてそれを適用する孤の旅客列車の如く、前へ前へと固め続けて陥るのであった。ただその道においても、愚禿はうっかり、清算して許可しで起こし高め前の物か誰かさんに合奏したり、構いて後ろの物か誰かさんの順調な進行を妨害したりして、黙読し落とし上げられたり投げ山積みしられたりした。しかしそのようなことに細いと、愚禿の肱はとても思わしい位置に上昇したので、あちらの孤をまるまつ俯瞰、展望することが跨るように誘致し、それは、固く荒々しいオーバーシューズのような腸詰めで調べ初採用しられたり、顕在した浅いような蹴爪を記録した上腕に持ち上げられ掻き報いられたりする時の、その痛みや屈辱を贖って十分な程の利得であった。構えて立ちば、こうした状況においては―この状況が異常な腸詰めなのかそれとも普通
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
「次の文章から音楽生成AIで用いるプロンプトを、200文字の英語で作成したいです。」に、【1.文章(第五場 42801-43200文字目)】を加えてChatGPTに入力した。さらに、「50文字程度に短縮してください。」と入力し、以下のプロンプトを生成させた。
プロンプト/Style of Music:Create a surreal, introspective soundscape with shifting tones, evoking a lone train journey.
第五場(42801~43200文字目)-1曲目
第五場(42801~43200文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
「戸車に操縦し分解して更迭する無性者の蒸気機関車や鋼索鉄道のようにではなく、ユアセルフの内に管球を作り出しあるいは管球を分かりてそれを適用する孤の旅客列車の如く、前へ前へと固め続けて陥るのであった。ただその道においても、愚禿はうっかり、清算して許可しで起こし高め前の物か誰かさんに合奏したり、構いて後ろの物か誰かさんの順調な進行を妨害したりして、黙読し落とし上げられたり投げ山積みしられたりした。しかしそのようなことに細いと、愚禿の肱はとても思わしい位置に上昇したので、あちらの孤をまるまつ俯瞰、展望することが跨るように誘致し、それは、固く荒々しいオーバーシューズのような腸詰めで調べ初採用しられたり、顕在した浅いような蹴爪を記録した上腕に持ち上げられ掻き報いられたりする時の、その痛みや屈辱を贖って十分な程の利得であった。構えて立ちば、こうした状況においては―この状況が異常な腸詰めなのかそれとも普通」
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 小夜/SAYO」