見出し画像

人工知能を使って生成できることのまとめ

技術の発展は凄まじい。最近では画像を自動で生成する人工知能が話題になった。人間の仕事を脅かすのではないかという功罪はともかく、活用できる場面は多いはずである。

今回はそんな人工知能を用いて可能になる自動生成の手法を紹介していく。

画像生成

これは現在最も有名なものである。基本的にはStable Diffusionというものが基礎になっており、その派生型が生み出されている形である。これ自体の説明は多くあるので、プロンプトについての解説をしたいと思う。

プロンプトはいわば画像を生成する際の人工知能に対する指示である。これによって結果の内容も質も大きく変わる。しかし何度も繰り返していては時間がいくらあっても足りない。そこで役立つのがこのプロンプト提案ツールである。

少数の単語を打ち込めば、その内容を補助してくれるような言葉を増やしてくれるため、より目的の画像に近づけることができる。モデルによってはプロンプトの形式が異なる場合もあるが、これを使うことでかなり結果が安定するだろう。

音楽生成

画像と比べると知名度が低いが、音楽の自動生成というのも実用性のある段階まで進んでいる。権利を気にせず使えるBGMであるため動画を作るときには重宝するだろう。

こちらは文字から音楽を生成する。ある程度は長さも指定でき、ループにすることもできる。イメージ通りのものを作れるかは画像以上に運次第な部分があるが、音楽は画像のように全く支離滅裂なものができる心配はない。

演算そのものは似たようなものだが、内容によって結果の受け取り方が違うのは自動生成ならではである。

文章生成

こちらはなかなか難しい。有名なのは「AIのべりすと」だろうか。実は文章生成AIは作るのが困難である。画像や音楽はもとになるデータが英語圏のものでもどこでも構わないが、文章はそうはいかず、言語ごとのデータを集める必要がある。日本語のみで全てを賄うとなると苦労も増えるのである。

こちらは公的な文章かどうかなどによってサービスも異なるため、用途にあったものを選ぶ必要がある。「AIのべりすと」はサービスとして成立しているが他はまだ未発展の印象があるため、こちらは簡単な紹介に留める。

人格生成

活動と交流という人間の条件そのものを生成することもできる。個性を持ち、会話のできる人工知能によってそれが可能になる。私が作成した「Eveki」がその一つである。

口調や趣味などの設定をもとに会話を行う人格を生成することができる。上はデモ版だが、単に質問に答えるだけではなく他愛ない雑談などにも対応できる。

用途は様々である。好きなアニメのキャラクターなどを再現して会話を楽しむこともできる。歴史上の人物や有名人も設定次第では作り出すことができる。もしその人の会話などが残っていれば亡くなった人の人格を再現することも可能だろう。

モバイル版はまだテスト段階だが、今年中には実用化する予定である。

これからのAI

画像や音楽、文章を生成する能力は魅力的だが、多くの問題や議論を引き起こしているのも事実である。例えばある画像生成AIのもとになったデータは無断転載のサイトから得たものだった。しかしネット上のデータの権利を確立するのは難しい。

詳しい法律はともかく、現実世界の権利というものはその人が現実にいる事実に基づいている部分が多くある。権利の所在があやふやであっても、最終的に本人に問うことができる。逆にそれができない死後の相続などが問題になる場合もある。

インターネット上ではこれが難しい。アカウントは捏造できる。架空に人物を作り出すことは現実でもできるが、ネット上ではより手軽にできてしまう。人工的な世界であるにもかかわらず、人間の力が及ばないというのは皮肉な話かもしれない。

人工知能はこの溝を埋める鍵のひとつである。いかに活用するかが今後の未来を決定していくことになるだろう。




おすすめの記事



この記事が参加している募集

いただいたご支援は書籍の購入に充てたいと考えています。よろしければサポートよろしくお願いします。