日記240511 (ツイートの補足)

 ツイート2つについて細かい技術のメモ。

音源

 Pluggo VocaleseはただのROMplerである。もとから作られた/録られた声のオーディオファイルが何十個か入っていて、MIDIのトリガーで再生されるだけ。ピッチはドレミには反応せず、Speedノブで変える。

 これを曲に合わせてちょっと歌ってるっぽいフレーズの生成を目指す。

リズム

 ただの1本のロングノートだけを入れて、Arpeggiatorで8分音符の連打にする。RateにLFOをかける。

 WaveformをBinaryにし、DepthとAmountをうまいこと設定すれば、ArpeggiatorのRateを「1/8か1/16かをランダムで」にできる。LFO側の周期は適当に早めにすることで、Arpから出るノートは「普通に8分音符」「16分音符」「頻度は8分なんだけど鳴ってる途中でRateが切り替わったことにより長さが短い」の3パターンになり、これがバリエーションあるリズムを生む。

 またArp側でGrooveをSwing 16にすれば、16分が裏で鳴るタイミングでだけ勝手にハネてくれる。

言葉

 MIDIのドレミが言葉に対応しているので、Randomをかけ続けることでランダムなドレミになる。VocaleseはE2〜G#2が息のみの音なので、C1に対して+15までのランダムにすることで、息のみエリアを避けている。

 別策として、Randomを使わずに、MIDIクリップの方にノートを大量に並べてからArpeggiatorのStyleをRandom Otherなどにするのもいいですね。MIDIクリップの用意が面倒な代わりに、鳴らしたいノートを細かく選定できる。

ピッチ

 元々歌わせる用のpluginというよりは声ネタ再生機にすぎないので、あとでAutoTuneをかけることにする。そこで面白い効果が生まれてほしいので元のピッチもめちゃめちゃランダムにしてしまおう。Expression ControlのRandを、VocaleseのSpeedに適当に繋げば、1音鳴るごとにSpeedが適当に変わる。

 でもこれはべつに非同期のLFOとかでもよかったな。1音の発音途中でピッチがぐねっと変わったほうが、AutoTuneかけたときに面白い気がする。これはChuck Sutton (みんながLive 12デモソングを聴くずっと前から大好きだったんだからね!!!!!!!古参アピ) が昔紹介していた手法。

 ちなみに「LFO binでArpの1/8 - 1/16のリズムを生み出す」も↑の動画で紹介されてるけど、これは真似てない。ていうか今動画見たらそこまで一緒だったのか……おれ丸パクリじゃんと焦ってる。

 そんで、AutoTune持ってないのでVocalSynth 2に通す。まあ適当にキーに合えばいいので、7音スケールでもペンタでもいいが、今回はii iii viのみに絞った。oct下も足した。あとは運次第。

その他

 あと適当にドラムとかベースを足してオンオフして終わり。

 各トラックのキック・ダッキングに、Kickstart 2のAudio In検知を使ってるんだけど、VST3を使ってSidechainの入力モードをPost Mixerにしておくことで、キックのトラックのミュート中はダッキングしないようになっている。

 普通のサイドチェインコンプだと、あとでミックスバランスを変えたくなってキックの音量を上げ下げすると、ダッキングの深さに影響してしまうのでPost Mixerは中々危なっかしいのだが、Kickstartなら「とにかく何か鳴ったら固定量のダッキングをかけます」なので安心して使える。

動画撮影

 F1〜F8キーはトラック1〜8のミュート切替のショートカットになっている。これでMIDIコンとか使わなくても、キーボードアサインとかしなくても、サクッと雑な演奏が録れる。


Pluggo

 ツイートしたけど、このVocaleseが入ってるAbleton Packは無料配布されている。元々2003〜2005あたりにCycling'74 (Max/MSPの開発元) が、Maxで開発したVSTのPlug-in Bundleをリリースしてて、いまはM4Lで使えるよってことらしい。

 当時を知らないので間違ってたらごめんけど、PluggoとはMax→VSTのwrapperというか、DAW上でMaxを使えるようにする橋渡し的なアレだったとのこと。で、即戦力の実用例としてPlug-in Bundleも同封されてたのかな。

 VocaleseはBundleの中でかなりギャグっぽく、他のPlug-inはめちゃめちゃまとも、というか芳しいプログラマーの香りがしてくる。オーディオ処理基礎を学ぶ教材としてはイイと思うが、制作のために今いれるものとしてはそんなに魅力的ではないと感じた。


chip vocal

が好きだ。そんな言い方あるのか知らないけど。Atari ST、MacinTalk、IBM704、Texas Instruments。人の声をロボ声っぽく音色加工するより、打ち込みの行程までが機械的だったり、Text To Speechのほうが断然萌える。VocoderやTalkboxやケロ声やデジタルクワイヤやボカロとは違う話をしています。UTAUはギリギリ"こっち"かも。意味のある歌詞はそんなにいらないけど。
 Plogue chipspeechは神プラグイン。Commodore 64のspeech synth再現のAUSpeekとかあったけど今動かないな。加工側だけどSonic Charge Bispeekはクオリティ高い。終売してるけどKORG iDS-10でTTSで生成したセリフにVocoderかけられるのは激萌えだった。VitalにText To Wavetableあるのとか感涙です。今回のVocaleseも文脈を踏む3Dおじいさんの絵がついていつつ出音がアレなので結構"アリ"。
 2001年宇宙の旅のHAL 9000が劇中でDaisy Bellを歌うのはIBM 7094が最初に歌ったコンピュータを言われているのを踏まえている。TI Speak & SpellLittle MaestroあたりはUVI Toy Suiteで鳴らせる。前身のElectric Toy Museumにしか入ってない音源もある。
 Sparky's Magic Batonという40年代の童話レコードでは「楽器や車が喋りだす」再現のためにSteel Guitarやその他の音とTalkboxの組み合わせが使われる (Luke Vibertがサンプリングしているのでそれも良い)。Pete Drakeの演奏動画はYouTubeによくある。おれのアルバムでRemixしてくれたりMaltineから出してたGoodnight Codyもやってたな。Codyは前名義でもロボボーカルやってるし。なんか古いmacで動くロボボーカルソフト教えてもらったんだけど忘れちゃったな……MacinTalkに譜面エディタつけたみたいなやつ。
 そしてGangpol und Mitだよなやっぱ。今は亡き三軒茶屋Hell's BarでG&Mかけてたら外国人客に「あの演歌っぽいやつかけてよ!」って言われてわからなかったのがこれは全然演歌ではなくないか?後年初音ミクも使ってたがやっぱ使い方がいいよな。
 竹村延和の10thはspeech synthにかなり特化してて好きだった。国内electronicaの流れだとeaterのこれも好きだった。アーバンギャルドの傷だらけのマリア (パソコン音楽クラブ REMIX) はメインボーカルの隙間をTTSで輪唱するアイデアが最高だった。わたしのココは東芝DynaBookのLaLaVoiceというソフトをずっと使っているみたい。国産の歌唱合成だとAquesToneというのもあって、Keijiro Takahashi (= Denkitribe = よよP) 氏の演奏動画見て自分も高校生のころ遊んでいたなあ。
 有名どころだとCylobのRewindはラップしつつサビが牧歌的でかわいいし、Ambient News名義でもちょっぴり聴ける。DEDEさんのmurmur on my footはchip vocalではないんだがRewindの自己解釈だと思ってる。HrvatskiことKeith Fullerton WhitmanがKid 606のRemixしたやつではスレンテンブレイクコアの上で歌うロボが聴ける。AtomTMもいくらか。
 あとおれはマジのchiptune文脈に入らないことにしてるのだが (沼すぎるし、オケにこだわりがないから) いい曲が多分たくさんあると思う、Goto80mikron 64Fantaあたりが好き。声専用のUIを使わずピッチベンドと波形メモリで掛け声の雰囲気を出すchibi-techは当時衝撃だったし、歌に限らず声になると昔からゲームでどう工夫されてきたかは気になる、現在でもどうぶつの森は個性ある抽象化をしているし。ちょっと話違うけどDELTARUNE chapter 2のスパムトンの曲のラップ的セリフの質感も最高。
 そういえばNative CellのBeautiful Machineは別に声っぽい音を使っていないのだが、さまざまな家電や機械の音がリレーしてメロディをリレーしていくのがめちゃめちゃ喋ってる、語りかけられているように感じられて物凄い。声じゃないのに何か言おうとしてる。必聴です。

 機械が歌えばいいのかというとボカロはあんまり……と思っているように、半端に不自然な状態を愛でている。生成AIも育ちきって完全にキレイになったものより、異常が発生してる過渡期が面白かったわけで、目的の違いだ。そもそも人らしく振る舞うロボが好きで、ウォレスとグルミットのチーズホリデーに出てくるロボットとか、Wagon Christ ReceiverのMVとか。一方でタチコマやファイアボールのように言葉が堪能だと興味から外れてくる。人と同等の人格があるなら機械でなくても良いよね、とフェチズムでの捉え方ではなくなる。
 で、ずっと考えているのが、その「未熟さを愛す」はある種のロリコンなんじゃないのか?という問題意識だ。Born Sexy Yesterdayという概念が提唱されていて、いくらかのフィクションのストーリー構成において、例えば「造形は若くセクシーな女性だが、アンドロイドやエイリアンやタイムリーパーだったりするがゆえに無知で純粋で子供のよう」、その未熟さによってキャラ立てしたり物語を駆動させていく類型があるよね、という話だ。そういうのを無邪気に支持し世間に定着させ当たり前に目にすることが規範意識を強化するよね、という理屈は痛いほどわかる。刷り込みの話だから、現実と創作を意識的に区別しよう!では解決しないんだよね。翻って自分の未熟なロボットフェチを考えると、ジェンダーにタッチしてなきゃいいのかというと、やっぱすごく遠回りした先にBSYとのつながりは見えてくる気がする。好きなものは好きなんだけど、こんなことしてていいんか、とは常に思う。



Buffer Shuffler

 Buffer ShufflerはMax for Live Essentialsに入っていて、これも無料。

 決まった長さ(初期設定では1小節) を最初に録り溜めて、8分割とかにして配置換えして再生できる。録り溜めは順次更新されていく。Diceボタンを押すとランダム配置ができるのだが、Autoボタンもつけておくと1ループするたびに勝手にDiceを実行してくれる。これにより、放置しても無限に組み替えられるBreakbeatsを生成することができる。

 しかし問題は、ただただランダムなので、身を任せていると小節頭がどこかとか全然わからなくなってしまう。たとえばドラムにかけないでウワモノのフレーズだけ組み替えるならオートでもいい気がするが、このようにドラムに使うとけっこう厳しい。そこで、キックだけは別トラックに移して、キックが鳴った時はKickstartでBreakbeats側をミュートするようにした。これにより、1, 3小節目の1拍目はランダムを無視して必ずキックが鳴るので迷子になりにくい。Jungleは小節頭でスネアが鳴っても楽しいので、2,4小節目は小節頭ではない1箇所で固定のキックを鳴らしている。

 Buffer Shufflerの問題点を一つ。Diceを一回振るとundo historyが一つ更新される。ので、Auto Diceのまま再生中・あるいは再生前になんかマウスでいじってたとして、Cmd+Zを押しても戻れない。何度か押したら戻れるがその回数はわからない。
 undo history汚染はM4Lデバイスの設計が甘いとよく遭遇する。気にしてない開発者は気にせず公開してるので注意。

Beat Repeat

 高速ロールも定番なので自動化した。1小節に8回、10%の確率で、8分音符続くロールが発生する。ロールスピードはLFOによって1/8〜1/64のランダムになってる (1/8を引いた場合何も起きない。8分の連打ならBuffer Shufflerの方で偶然引くことがあるからこっちでやれなくてもいいね)。

その他

 あと適当に上モノとかベースを足してオンオフして終わり。


高速Breakbeatsの自動生成

 昔から「簡単なBreakcoreの作り方」とかいって自動でAmenを刻むみたいなのは無限にある。おれも大学生の時Ned Rushの動画の「1分でできるBreakcore」とかに夢中になったなあ。
 で、楽しいのでいいんだけど、楽曲にする上では正直、自動化しないで手で組んだほうがいいっす。苦労の美徳とか、作者のクセが出たほうがいいとか、マクロで事務するなとか、履歴書は手書きしろとか、専業主婦は冷食に頼るなとか、そういう話じゃなくて、単に手で組んだほうが断然出来が良くてかっこいいから。
 もちろん自動化でかっこよくできるならいいんだけど、まだ中々70点止まりな感じがすんだよな。↑では「キックの固定」みたいな要素を足したことである程度コントロールが効いたが、ロールタイミングもただのランダムだし、人為的な快感の要素をどれだけ盛り込めるかは使い方にかかっている。で、どんどんピンポイントで直していくと、最初から手で組むのとあんま変わらなかったりする。

 よくあるいいとこ取りの発想としては、とにかくランダムでフレーズを生成して、それを丸ごと録音しておいて、美味しいところをかいつまんで組み立てる手法だ。ランダムブレイクビーツを数分録っといて「イケてる!」とこだけ切り取ってくるなり、「小節感が狂ったな」「声ネタが下手に連打されちゃったな」は取り除くなり。素材自作のつもりで実行すれば、あとの制作工程はSpliceでやるのと変わんないので。いい時短じゃないでしょうか。

投げ銭いただけたら、執筆頻度が上がるかもしれません