『ロア・マシーン(Lore Machine）プロンプト不要、ストーリーボードや絵コンテ専用AI』～【web3&AI-テックビジネスのアイディアのタネ】2024.3.7

モリプトタツヤ

2024年3月7日 09:06

「先進テックで未来の生活はもっと良くなる！」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。

新規ビジネスのアイディアのタネがほしい方、未来を想像してワクワクしたい方、読んでちょっといいなと思った方、ぜひフォロー・高評価よろしくお願いします！

■プロンプト不要、生成AIで誰でも物語からマンガが作れる

テキスト-画像生成AIは物語性のある複数の画像を生成するのが苦手だ。複数の画像で、設定に一貫性を持たせるのが難しいからだ。だが最近、物語を一度入力すると、それに合った一連の画像を生成するサービスが登場した。

生成AIの「実用性」の課題を大きく解決するソリューションが登場しました。

「ロア・マシーン（Lore Machine）」という生成AIプラットフォームです。キャッチコピーには「Story Visualization System（ストーリー視覚化システム）」と表現されています。

ロア・マシーン（Lore Machine）が解決すること

ロア・マシーンでは、これまでの画像生成AIの課題を大きく解決します。

・プロンプト不要
・シーン全体に一貫したキャラクターを登場させられる
・結果、画像生成AIにビジネス上の実用性、使い道を与える

・プロンプト不要

ライダーが短編映画の台本を送ると、カンピオンCEOはロア・マシーンを使って、一夜のうちにそれを16ページのグラフィック・ノベルにしたのだ。

この一文にロア・マシーンの特長が表れています。

小説や台本など長文のストーリーを入力すると、シーンや登場人物をAIが解析して、複数枚のグラフィック・ノベルを生成する、というのが基本動作です。

Stable DiffusionやMidjourneyなどの画像生成AIは、構図や画風などの情報をすべてプロンプトとして入力する必要がありました。これは画像生成AIの使い方が「絵画の手順を言葉で説明する」というものだからです。1枚の絵を狙い通りに仕上げるには当然に必要な作業でした。

しかし画像生成AIのプロンプトの書き方・描き方は独特なテクニックを必要とします。テキストから誰でも簡単に素晴らしい画像が生成できることが売りだったはずが、今やプロンプトの書き方を習熟した人にしか扱えないツールになりつつあります。

ロア・マシーンは、映画の台本や漫画の原作小説などの文章をまるごと入力することで、シーンごとにグラフィック化します。生成される画像の1枚1枚を追い込むのには向いていませんが、絵コンテで全体を確認するのには向いています。

何より、独特のプロンプトの書き方を学ぶ必要がなく、1度に3万語までの文章をそのまま入力すればいいため、誰でも扱うことができます。

イラストは、用意されたさまざまなスタイルで生み出され、マンガから水彩画、80年代の低俗テレビ番組風まである。

画風は選択肢になっています。画風のオリジナリティを追い込むことが目的ではなく、ストーリーを絵に起こして全体をビジュアルで把握することが目的のツールだからです。

・シーン全体に一貫したキャラクターを登場させられる

人や場所に関する描写と、全体の情緒を特定し、ステーブル・ディフュージョン（Stable Diffusion）のあるバージョンが画像を生成する。

長い文章の全体に一貫して同じデザインのシーンやキャラクターを出し続けることができるのがロア・マシーンの特長です。

通常の画像生成AIの使い方では、毎回生成結果が異なるという「画像生成ガチャ」と呼ばれる一貫性のない絵が出てしまうことが課題でした。そのため、1シーンごとに画像を生成させて絵コンテを作ろうとすると主人公が毎回違う見た目になって使い物になりませんでした。

LoRAモデルのように統一するキャラクターを学習させたうえでシーンごとの画像を生成させるような方法もアリはしますが、これもまた生成AI独特の技術習得が必要で難解です。

ロア・マシーンでは、最初に台本を1本読ませると、シーン、登場人物、場所などを解析します。ロケーションや役者を決めて、彼らにロケ場所で演じてもらうのとまったく同じ手順です。

その仕組みは非常に上手いものであるが、完璧ではない。
私が作った物語のあるシーンでは、短髪のキャラクターの前髪が伸びてしまっており、別のシーンでは、同じキャラクターが２回出てくる。イラストが特徴を欠いているようにも思えてくるかもしれない。しかし、手作業で、延々とプロンプトを入力するのに比べれば、かなり大きな進歩だ。

ロア・マシーンもまだ完全ではありません。結局Stable Diffusionを使っているため、まだガチャ要素が混じってしまいます。それでも1枚ずつ生成させるよりは圧倒的に一貫性が保てます。

・結果、画像生成AIにビジネス上の実用性、使い道を与える

「画像生成の面ではそれほどでもなかったのです。ストーリー性の高さに圧倒されました。物語の流れからキャラクターの感情まで、最初からバッチリでした」

画像生成AIが出力する絵は驚くほど高品質ですが、日常的に絵を描く必要に迫られている人は多くありません。

逆にイラストレーターや広告デザイナーなど商業デザインの仕事の中では、狙い通りの絵が作れないAIではアイディアを得る程度の使い方にしか使えません。

そのため、画像生成AIはChatGPTほどビジネスシーンで利用されず、端的に言えばお金になりにくいのが課題でした。

ストーリーボードとは、イラストを用いて特定の商品・サービスを利用したユーザーの体験を理想のストーリーとして表現するフレームワークです。

ロア・マシーンは、製品開発で利用シーンをイメージするストーリーボードの作成や、映画やドラマなど映像作品の絵コンテを作るという実用性に特化したツールです。

映像作品を作る仕事に就いている人は多くないかもしれませんが、上記のように製品やサービスの開発に携わっている人、その製品を消費者に届けるマーケティング業務に従事している人は多くいます。

上記の簡単な画よりもずっと豊かなクオリティで、短時間に大量にストーリーボードを作れるならば、社内の合意形成や問題点の洗い出しがより高速・精緻にできるようになります。

つまり、画像生成AIが趣味的な使い道に留まらず、ビジネス上の実用性を得たことでお金を生むツールとなるのがロア・マシーンの真骨頂です。

1カ月10ドルで、10万語（1度に3万語まで）のテキストをアップロードし、短い物語、台本、ポッドキャストを書き起こしたものなどから、80枚の画像を生成できる。ヘビーユーザー向けの価格設定もあり、エンタープライズ・プランは1カ月160ドルで、テキスト224万語、画像1792枚までに対応する。

ビジネスユース想定では1か月160ドルと比較的高額ですが、画像1792枚では足りない人がもっと使いたくなるのではないでしょうか。

簡単操作と専用化がトレンドに

プロンプト不要の操作性や特定ジャンルに実用特化していく方向性は他のAIにも波及するだろうと思います。

OpenAIの動画生成AI「Sora」も、趣味で生成させる遊びは長く続かず、SoraベースでUIを改善し用途を特化したサービスが次々に登場するでしょう。

ロア・マシーンがその流れの口火を切った格好ですが、プロンプト不要の簡単操作とジャンルや用途に特化した専用化は今後の生成AIのトレンドになるのはおそらく間違いありません。