noteに移行して半年経ったので生成AIについて振り返る - Blog 2023/11/01

2023年11月3日 22:16

2016年10月〜 Adobe Senseiと共に歩む

多分、AI画像を初めてTwitter (現: X) に投稿したのが、2017年4月24日だったと思います。撮影した写真をAI (Style Transfer)でスケッチ風にしたり、マンガスタイルにして投稿していました。
AIとクリエイティブに興味に持ち、AI画像などを作成するようになって、6年以上経ちました。

今、iPhoneで撮った写真をAIで漫画背景に変えてもらう。何度試してもすごいものだなぁ。 pic.twitter.com/KVb8uIU5Dw
— Creative.Edge (@commonstyle) April 24, 2017

Lightroom webを見ると、2017年〜2018年で3,000枚以上のAI画像を作成していました。大半が、iPhoneで撮った写真のスタイル変換です。

AIとクリエイティブに関する講演は、この6年間で50回以上はやっていると思います。ちなみに、Adobe Sensei（AdobeのAI技術及びサービス等の総称）が登場したのは2016年に開催された「Adobe MAX 2016」。
AIクリエイティブに関する活動のスタートはここです。

余談ですが、Adobe Photoshopに搭載された最初のAI機能は、2005年のスポット修復ブラシだと思います。フォトショユーザーにはお馴染みの「コンテンツに応じて拡大・縮小」は2008年、「コンテンツに応じた塗りつぶし」は2010年ですね。

この頃は「AI」とは言わず、マジック（魔法のような機能）と表現していましたが、2012年以降のAIブームからAIや機械学習というワードを使うようになりました。そして、2016年10月「Adobe Sensei」ブランディング開始となったわけです。

画像生成AIの幕開け

昨年の7月〜8月に登場したMidjourney、DALL·E 2、Stable Diffusionによって、画像生成AIが身近な技術になりました。それまでは論文が公開されるだけで、実際に試すことができなかったのです。
Adobe Fireflyはかなり後発です。今年の3月21日にベータ版が公開されました。まだ、7か月ですね…

Midjourneyはもう1年以上使っているので、今まで生成した画像の数は「27,294 Jobs」です。

AIクリエイティブの活動報告は自分のWebサイトで公開していましたが、情報も急増し煩雑になってきたので4月18日からnoteに移行しました。
Midjourneyに関するVlogや記事は以下のマガジンにまとめています。

下図の左側が3月に生成したMidjourneyの生成画像です（バージョン4ですね）。右側が今日 (11月1日) に生成した画像。バージョンは5.2です。
プロンプトは同じものを使用しましたが、映画監督の名前が含まれていたので、そこだけ削除しました。3月はまだ有名なアーティストの名前や作品名などを使っていたんですね（5月以降、現在の生成AIポリシーを遵守しています）。

spacecraft cockpit interior, red plastic, lived in, 1970s, fujifilm, panavision 70, porta 400, Fashion model of a pretty girl wearing space suit style eyewear reminiscent, lightfull, wide angle, moody, award winning photography, Unreal Engine, 8k --ar 3:2

当時のプロンプトをShorten Commandで解析してみると、カメラのレンズやフィルムの記述などはほとんど効いていないことがわかります。この頃は、なんとなく使っていた「おまじない」がたくさんありました。

Adobeの生成AI (Firefly) の検証については以下のマガジンに登録中。

画像生成AIが登場して、まだ1年と3か月しか経っていない。この間の技術進化が凄まじい。そして、ついに動画生成AIも登場します….

動画生成AIも登場

今年の2月6日、RunwayのGen-1が発表されました。ついに動画も生成できるようになった！と感動していたら、すぐにGen-2の発表…
Gen-2が6月に正式リリースされてから、SNSにはAI生成動画が大量に投稿されるようになりましたが、動画生成の品質が大幅に向上したのは、確か7月22日だったと思います。約3か月前のことですね。

動画生成AIの検証はこちらにまとめています。

参考：
Adobeはビデオと生成AIに関する、こんなコンセプトムービーを公開しています（参考：Future Vision: Adobe Firefly for @AdobeVideo）。Premiere ProにもFireflyが実装されるのかな…..

もちろん、テキスト生成AIも…

画像生成や動画生成については想定内でしたが、LLM (大規模言語モデル) は衝撃的でした。Transformerが発表されてから定期的に情報収集していましたが、昨年の11月に公開されたChatGPTでやっと具体的な利活用のイメージが見えてきました。
現在、ChatGPTはマルチモーダルになり、画像の解析、画像生成も可能になっています。

「主な画像生成AIのタイムライン」PDFダウンロード：

20231103-Timeline_image_generation_AI.pdf （2023年11月現在）

今後は「既存のデザインツールのようにパネルから表現したい要素を選択しながら生成する方法」や「チャットベースで対話しながら生成する方法」が、画像生成の主流になっていくでしょう。

画像生成AIのUI：

プロンプトだけで表現する原始的な方法
プロンプトとスタイル機能を組み合わせて表現する方法(Firefly)
チャットベースで対話しながら表現する方法(ChatGPT, Microsoft Copilot)

ChatGPTを活用したクリエイティブについては以下のマガジンにまとめています。

今後のこと…

画像生成AI:
今後、画像生成AIはさらに品質が向上して、人間の手やポーズ(関節)、群集などの表現も破綻なく生成できるようになっていくでしょう。
写真と生成される画像が区別がつかないレベルとなり、特定の専門分野ではアーティストの作品と競合する可能性が高くなります。

動画生成AI:
動画生成AIも同様に急速に進化しているため、一貫性が維持された長時間の動画生成が可能となることが予想されます。数分間程度の高品質なビデオクリップの生成が現実的になり、今後1〜2年で映像業界にも大きな変革をもたらす可能性があります。

加工に強い電子透かし技術:
生成AIの画像や動画に不可視のウォーターマークを埋め込むことで、それがAIによって生成されたものであることを識別できるようにします。これにより、クリエイティブな用途には制限を加えずに、生成物がフェイクとして悪用されるのを抑止することが可能になります。

メディアリテラシーの強化:
学校教育では、生成AIに対応したメディアリテラシーを組み込むことで、生徒は生成された画像の検証方法を学びます。どのようにして画像が生成され、それが現実とどう異なるか、またどのような意図で作られたかを考察する力をつけることになります。

企業向け保証プラン:
AI生成サービスのプロバイダーは、企業顧客が著作権侵害で訴えられた際に法的支援を提供するプランを導入するでしょう。使用料に含まれるサービスの一部として提供され、利用者が法的な問題に直面したときにアドバイスや代理人サービスを受けられるようにするものです。

保険プランの提供:
AI生成サービスのプロバイダーは、著作権侵害訴訟に対応するための保険プランを企業顧客に提供することで、利用者のリスクを軽減します。

免責条項:
AI生成サービスのプロバイダーは、サービスの利用規約に免責条項を設けていますが、個人の利用者はこれらの規約に同意することで、法的な問題が生じた際には自己責任で対応しなければいけないことを理解しておく必要があります。今後、利用規約の内容についての議論や啓蒙活動が活発化していくでしょう。

更新日：2023年11月03日（金）／公開日：2023年11月01日（水）

この記事が気に入ったらサポートをしてみませんか？