見出し画像

【イベントレポ】どうしたらいい?AIアートの新時代。画像・動画生成AIについてマスターしよう!

皆さん、こんにちは!
ぶっちゃけ系エージェント、ROSCA広報のSahoです。

3月27日(水)に弊社ROSCAが運営する「ROSCAFE」にて「どうしたらいい?AIアートの新時代。画像・動画生成AIについてマスターしよう!」を開催しました!

この記事では企画・運営、そして当日のモデレーターを勤めました私、Saho@ROSCA広報目線でイベントの様子をお伝えしたいと思います!

今回の講師:AI Picasso株式会社 三嶋 隆史さん



今回のテーマで講師を務めていただいたのはAI Picasso株式会社の三嶋さんです。AI PIcasso社は日本発の画像生成AIサービス「AIピカソ」「AI素材.com」の運営を行っている企業です。
「AIピカソ」はあの「いらすとや」ともコラボをし、いらすとや風のイラストを生成する「AIいらすとや」や、「AIアバター」、「AIペット」が生成できるサービスもリリースし、2024年1月15日には世界初の生成AI動画機能「AIダンス」をリリースしました。(実際の映像のように踊るAIには驚いた人もたくさん居たのではないでしょうか!?)

本編

当日の資料はこちらからご覧ください!


ここ数年のAIの動向として、Stable Diffusionが、2022年の8月にリリースされ、Dream-basedという画像生成で顔や物を学習させて生成することのできるAIが登場したりなど、言語モデル、画像モデルの生成AIが2022年から2023年にブレイクスルーのような形で、1週間に1本、最先端の論文が更新されるぐらいの頻度の発展をしていました。AI Picassoさんでも情報に追い付いていくことが非常に大変な状況だったそうです。

そして近日、GPT4などが登場し、OpenAIが公開した「Sora」もかなり有名な動画生成AIになってきています。去年2023年は画像生成AIが1年かけてとても成長した中、今年2024年は動画生成AIの年と言われ、発展を遂げています。


画像生成AIのライブデモ

今回の会では実際にいくつかのサービスを使用し、実際に画像生成AIのライブでもを行っていただきました。(今回は銀河系の画像の作成に挑戦!)
美しい銀河系の画像が出力されました。


ライブデモのときと同じように、記事ではSahoが作成!



この銀河系に対してカスタマイズをしていくこともできます。例えば、AIに投げかける呪文のようなものを「プロンプト」と呼ぶのですが、このプロンプトで「太陽系も含めて生成してください」と入力してみます。しかし、惑星の個数がおかしかったり、木星が2つあったり、地球が大きすぎるなどクオリティの差は起きるものの、対話形式で調整していくことが可能です。限界はあるものの、指示を細かくしていくと徐々にクオリティが上がっていくようになっています。


次にDreamStudioを利用したライブデモです。このサービスは先ほどと異なり、かなり細かいパラメータまで調整ができるようになっています。
指など、人体が曲がってしまっていたり「この構造はいやだな」というものをネガティブプロンプトと呼びます。これを指定すると、除外され、生成されないということが可能です。

例えば美人な女性の広告を作りたかったら、「BeautifulWoman」などを入れて、「Poor」などのネガティブなワードをネガティブプロンプトとして除外して作るとかわいい・美しい女性が出てきやすくなります。この部分を調整していくと顔や表情が変化してきたりします。日本女性にしたい場合は「Japanese」と入力してみると若干顔つきが変わったような…?気がしました。

若干日本人っぽい…という部分にはAIの課題が隠されています。AIをうまく活用する上で「自分たちの今作りたいものに一番適合するモデルを選ぶ」ということが重要なのですが、AIにはまだ欧米向けのサービスが多く、日本国内に特化している!というものは少ないです。そのため、日本風なものがどうしても苦手になってしまいます。このように苦手なものが出てきたりなど画像生成AIは、既存のサービスのものを利用する場合はどうしてもかゆいところに手が届かない…という問題が起きてしまうそうです。


今回は「LoRA」についてもご説明いただきました。「LoRA」とは”Low-Rank Adaptation”の略で、特に大規模な事前学習済みモデルのファインチューニングに関連する技術のことです。AIの学習プロセスにおいて、基盤のモデルに別のパラメーターを「横付け」して、その部分だけファインチューニングさせる技術です。

これによって、ユーザーはAIに特定の概念やスタイルを追加学習させることができ、既存のデータセットにはない新しい要素を生成物に組み込むことが可能になります。たとえば「A」というアニメのキャラクターをAIに認識させるために、そのキャラクターに関するデータを追加学習させることで、「マイクを持ったAというキャラクター」「線画からの描画」など特定のキャラクターのスタイルで画像を生成できるようになります。また、日本風に特化したLoRAを作成することで、既存サービスのみでは生成できない日本に特化した画像の生成も可能になります。

今後の展望

さいごに、「今後どのような新たなクリエイティブな表現が可能になるでしょうか?」という質問について、ご意見をいただきました。AIによる3Dオブジェクト生成の進化は、ゲームデザイン、アニメーション、仮想現実など、新しい創造の形式を実現する基盤になり、動画生成AIの進化が、映像コンテンツの制作方法に革命をもたらす可能性も、三嶋さんは期待しているそうです。

さいごに

今回のイベントを通じて、AI技術が持つ無限の可能性が浮き彫りになりました。参加者のみなさまに新たなインスピレーションを提供できていたら、私達もとても嬉しいです!AIアートの新時代を迎え、未来のクリエイティブ産業がどのように変貌していくかの一端を垣間見ることができました。
改めまして登壇者のみなさま、ご参加いただいたみなさま、ありがとうございました!


改めまして登壇者のみなさま、ご参加いただいたみなさま、ありがとうございました!

今回も、最後までお読みいただきありがとうございました!
また次回の記事でお会いしましょう!



ROSCAでは、エンジニアに最適なキャリアを選択してほしいという思いから知識を持ったキャリアアドバイザーが毎日厳選したクライアントのみに絞ってお仕事のご支援をさせていただいております。
少しでも関心をお持ちいただけましたら、ぜひお問合せください。


ROSCAの話を詳しく聞きたい!興味があるという方はこちらの募集からどうぞ!




この記事が参加している募集

イベントレポ

この記事が気に入ったらサポートをしてみませんか?