見出し画像

小寺の論壇:生成系AIと著作権の関係は今どこまで来ているか

知財、IT産業、ネット、放送、買ったもの、ライフハックなど、コデラの気になるところを語ります。


5月25日に、衆議院議員の足立康史さんのYouTube「あだチャンネル」に出演することになった。お題は、「生成AIと著作権法を語る」となっている。

・生成AIと著作権法を語る
https://www.youtube.com/watch?v=ku38GuYcQwI

以前ITmediaで「AIが描いた絵の著作権は、誰が持つのか Midjourney画像の扱いを考える」というコラムを書いた事があるので、それでお声がかかったらしい。

・「AIが描いた絵の著作権は、誰が持つのか Midjourney画像の扱いを考える」
https://www.itmedia.co.jp/news/articles/2208/09/news162_3.html

この記事を書いたのが昨年8月で、かなり早い段階でまとめたものである。そこから著作権法改正などがあったわけではないので、具体的に法の射程が変わったわけではないが、他のところからも様々な動きや見解が出されてきているので、出演の予習としてあらためてAIと著作権の関係を整理しておきたい。

■生成系AIの今

画像生成系サービスも色々登場したことで、それぞれの特徴もでてきた。これらをまとめておく。

画像生成AI       種類   特徴
DALL-E 2         GAN  テキストから画像を生成できる |
Imagen            GAN   DALL-E 2よりも高品質な画像を生成できる 
Parti                VAE    テキストと画像の両方から画像を生成できる
Midjourney       GAN/VAE 他の画像生成AIよりも高品質な画像を生成できる
Craiyon            GAN/VAE テキストから画像を生成できる
Artbreeder    遺伝的アルゴリズム テキストから画像を生成できる
Deep Dream      DCGAN   画像から画像を生成するのではなく、画像をより幻想的または現実的にする
Stable Diffusion  潜在拡散モデル 日本語で条件を指定できるほか、画像からの生成にも対応

GAN (Generative Adversarial Networks)とは、生成器と判別器が競争的に学習することでリアルな画像を生成する手法だ。生成器は偽物の画像を作り、判別器は本物と偽物を区別していく。

VAE (Variational Autoencoders)は、入力画像を低次元に圧縮(エンコード)し、そこから元の画像を再構築(デコード)するプロセスで、新しい画像を生成する。

遺伝的アルゴリズムは、生物の進化を模した計算モデルで、最適解に近い値を探し出すことを得意とする。

DCGAN (Deep Convolutional GAN)はGANの一種で、畳み込みニューラルネットワークを使用して画像を生成する。入力層、畳み込み層、プーリング層、全結合層の4つの層で構成されており、特に画像認識に優れる。

潜在拡散モデルは画像をノイズのシーケンスとして表現し、ノイズを徐々に減らすことで画像を生成していく。

多くのサービスは、プロンプトと呼ばれるテキストを入力することで、画像生成の条件をしている。どれだけテキストにオプションを追加できるかで、不満足な部分を解消できるかが決まってくることから、こうしたプロンプトを開発するスキルを「プロンプトエンジニアリング」と呼ぶようになった。

またStable Diffusionのように、サンプルとなる画像やラフのイラストを用意してそこから生成させるという手法が取れるものもある。このように画像を示してAIに指示するスキルを「イメージエンジニアリング」と称してはどうかという提案もある。

■生成AIとは何か

AIに対する風当たりとしては、今年3月には、海外でGPT-4以上のAIの開発停止を求める公開書簡がまとめられるなどしたところだが、これに署名したイーロン・マスクが裏ではちゃっかりAI開発の準備を進めていたことで、なし崩しになった。

・GPT-4以上のAIの開発停止を求める公開書簡【内容まとめ】…マスクやウォズニアックなどが署名
https://news.yahoo.co.jp/articles/f0054dd1a4696a88475a6c5ddeb6e7eb3856e5fc

ここから先は

2,550字
この記事のみ ¥ 100

この記事が気に入ったらサポートをしてみませんか?