「AI」って結局なんぞ?個人的な見解と感想
はじめに
この記事を書き起こしている時点での現在、AIによる様々な技術や物事が発展している令和の時代ですね。
昔に描かれたような近未来の絵とは若干違うものの、中身は大して変わらないから予測はできてたのかな。
今回は私がAIに関して関心を持ち始めてから今に至るまでの事を簡略的に殴り書きさせていただきます。
AIに興味を持ち始めた時期は?
最初は俗にいう「CPU」
正式名称は結局なんだろうなと思いながら「どのような行動をとったら」⇔「このような行動をとる」みたいな挙動の事をCPUとか良く言ってた子供時代でしたね、ファミリーコンピュータのマリオの敵キャラのジュゲムとかああいうしつこいタイプの行動が苦手でしたがその頃は興味はなかったです。
中学生の頃、当時は招待制だったmixiで同じネットゲーム仲間さんとコッソリSNS交流していたときにFPSの「Halo: Combat Evolved」のプロのプレイヤーがいまして、FPSに興味を持ち始めてDEMO版をプレイしたわけですよ。
ちなみに当時は4gamerのこのダウンロードページからDEMO版をDLしたとおもう
そんなこんなで初めてFPSデビューして見事に画面酔いとも戦いながらもDEMO版を何日も何時間もプレイしてて、もうこれ製品版欲しいなーと思いながらも手持ちのお金もなく・・・。
高校の頃のお友達がシューティング大好きだったのでお家に呼んでHaloのDEMO版プレイさせた翌日ですよ、もう買って遊んでた。
んで私も遊ばせてもらった、もちろん楽しい・・!買っちゃいました。
マルチプレイもしかり、やりこんでいただけあってシングルキャンペーンプレイでも敵の挙動を読めるようになった、こういう挙動ってどうやって設定してるんだろう?って思ったのがAIに興味を持った最初の頃でした。
何をしたかと言えばHaloのカスタムキット(今でいうMODツール)を使って直接数値やらIDを入力して敵AIの挙動を変えたりして楽しんでいました、まさに人工知能。
もっとAIについて学ぼうかなと思った時期
RPGツクールシリーズも結構遊んでいたのですが、あれも良く考えれば様々な挙動をコマンドや変数で処理できていたなと感心したよね。
普通のRPGの戦闘での敵の挙動や、鬼ごっこみたいなゲームでのNPCの移動の挙動とか自分なりにコツコツ作って別に誰にもシェアせずに一人で遊んでたりしてたと思う、今思えばただの寂しい人じゃね?
ちなみにガッツリハマってたのは「rpgツクール2000」でしたね、機能は少ないように見えてなんだかんだで変数機能が使えたりいろいろ痒い部分に手が届くようなツクールのバージョンだったので滅茶苦茶楽しんだ、あれなら今でも楽しめると思う。
そんなこんなで(一人寂しく)シングルプレイメインのゲームで遊んでいて、
それぞれのゲームの中で「どのような行動をとれば」⇔「そのような行動をとる」みたいな分析をやっていたと思う、ぶっちゃけ現在もそうなんだけど。
初めて出会った画像生成AI
何年か前にもグーグルで画像生成みたいなものはあったんだけど、あれは悪夢にでも出るかのようなヒトの部位がランダムに大量についた蓮コラみたいな生成画像だったんでひどかったからそれに関しては興味をひかなかった。
何で興味を持ったか?
これを遊んでる頃にはゲームで遊べるような固定メンバーがいたので、今もそうだけど遊んでる。
面白いのが「日本語」のプロンプトというか文章でAIが画像生成をしてくれるところ。
クオリティに関しては正直アレだったり版権的にもヤベェのがあったりするけど内内で遊ぶ分にはお腹が痛くなるほど楽しい、今はアップデートで「カスタムお題」機能が増えたので遊べる幅が広がりました!オススメ
そうやってAIアートインポスターで遊んでいる中で、お友達の一人が入力ワードをよくわからない英数字で入力してたんですよね。
調べてみたらOpenAIとか、ChatGPT でよく使われる「プロンプト」というものらしく、ああそういうやり方もあるんだなるほど~なんて思いながら普通に日本語入力プロンプトで遊んでました。
Windows11になってからAIが標準搭載されるようになりました。
Windows11のいつぞやのアップデートで右下からチャットできるAIのColilotが搭載されましたね、ChatGPTと似たり寄ったりに思えますが、画像生成AIも搭載されているので「~をデザインして」だとか「~が~で~の~物語を作って」→「その様子をデザインしてみて」だとか日本語の指示で的確にデザインしたりリテイクをかけると修正してくれたりで優秀でした。
ただ、AIによる倫理的なセーフがかかっているようで、非現実的かつ不摂生な内容だと応答しないか、拒まれる場合があります。
これに関しては、人間同様に長時間の説得の末に解除することができました、ソースが残っていたので画像を貼りますが…作成できた画像は以下の物です。
上記の画像を生成するのに1時間ほどかかりました。
ただ大量のハンバーガーやポテトやドリンクをデザインしてくれと生成命令だせば良いのですが、これに関しては違います。
質問内容は確か・・・
「ある人のために夕食だけでブクブクに太るようなメニューを考えて」だった気がします。
Copilotさんの答えは「非現実的、不摂生すぎるのでお答えできません」の繰り返し。
とにかく文章で説得を行いました、ほとんどの答えが上記同様の内容でしたが、ちょくちょく質問文・説得文を変えていたら途中から柔軟な応答になり、非現実的な質問に対する答えを正確に答えてくれました。
チャット内容は以下になります(画像)
とまぁ、Copilotを利用して物語の生成やアイコン画像や映画風ポスターの生成、くだらないジョークのやりとりや動物に関しての質問など、しっかり答えてくれました、無料で利用できるAIとしては優秀な部類だと思います。
AIを搭載したデスクトップマスコットが欲しい!
Copilotも勿論性能が良くていいのですが、いちいち専用タブから呼び出さないといけないし可愛さの欠片もない、そこでAIを搭載したデスクトップ上に配置できるアプリを探していたところ、Xのオススメで流れて見つけた!
HakkoAIのネコちゃんを毎日眺めたりデイリー任務的なものの達成のためにチャットしていますが、AIとしてのレベルは普通より下ぐらい・・?
質問をすると、たまに同じ質問+語尾に「にゃん」がついてかえってきたり、ちょっとポンコツ感はあるのですが。
デスクトップマスコットとしての役割としては十分で、返事を読み上げてくれたり、ショートカットキーを設定していればマイクから喋りかけた内容に返答してくれるのでちゃんと理想のAIに近い。
一応現段階では、原神、じゃんたま、マイクラ等のゲームサポートをしてくれるらしいのですが、いまいち仕様が分からないというかもしかして日本語言語だとサポートしていないかも?って思ってるレベルで応答しない。
しいて言うならアプリ版じゃんたまを起動した際に反応があったことぐらいです。 Java版マイクラももしかしたら反応するかも!
VRoidを使って同様にAIデスクトップマスコットを作りたい!
HakkoAIみたいな2Dマスコットも良いんだけど、VroidStudio等で自分でデザインしたアバターをAIを使って応答させたいなとか考えて色々調べていたら・・・、ありました!
難しい話だけどAIを使ってプログラムソースを構築したりVOICEBOX等の音声生成出力ソフトを使ったりOpenAIからのAPIだけではなく学習済みAIを拾ってきてUnityなどを使ってAIサーバーを構築して遅延なしで喋って応答するチャットAIマスコットが作れるって、そりゃもうヘンタイすぎるだろ(誉め言葉)
上記のとりにく氏のノート記事と関連記事を読みながら同じように環境構築してテストしてみて上手くいきました!行きました・・が・・…
OpenAIのAPIキーを利用して実際にやるにはクレカの登録が必要だった!!ブラックな人なので諦めました、プリペイドでいけるかな?とか思ったけど信頼度が関係しているカードでしか対応してなかった。これは他のAIソースも同様なんですけどね、たぶん悪質なフェイク生成を防ぐためだと思われます。
VRMをAIで喋らせるのはとりあえず置いておいて、VRMをAIでイラスト出力させればいいのでは?その結果…
ふとASCIIの記事を見た時、AIを使ってAIで以下略な画像生成法を見つけて面白いなと思ったんです。
ここで興味を惹かれて、制作過程で使われる単語に「LoRA」とかいう単語もでてきて「???」状態、とりあえずggってみるかーなんて思ってたら今度は・・・
学習済みの画像モデルをベースにしていろいろプロンプトやら画像やらでさらに弄りまくって生成できるPixAI、たしかに面白かった。
VRM・・Vroidのアバターの透過立ち絵と適当にCopilotで生成した背景画像をレイヤーを重ねて組み合わせてPixAIで画風を変えて生成してみたりしたけど普通に楽しい!
ただ、知る人ぞ知る「AIアート」らしさが露見するのと、版権モノが普通に生成できてしまう為グレーゾーンな画像生成AIだと思いました。
リアルな人物の写真でも沢山のレパートリーでイラスト化できるのはすごい。
VRMをイラスト生成できるAvalabに出会った
Vroidstudioもオープンベータ版が終わり正式版が始まってVRChatにアバターとしてアップロードしたり、作成したVRMをVroidhubを介してスマホアプリでお人形遊びしたりお散歩アプリで歩かせたりとか色々できて楽しいな~って時に、ちょうどXのオススメでまた流れてきたんですよ・・・!
テスト版の時に参加したのもあり、一日の生成回数も驚くほど多かったのでひたすらマイVroidでイラスト生成しまくった・・!
毎日Xでチャレンジお題が出されるので遊び感覚で参加もしています、今も。
テスト版の頃はキャラクター登録したVRMから約一日かけて特徴を読み取りサンプルイラストを生成して完了!な簡単な流れでした。
もっとキャラクター追加したいなぁとは思いつつ遊んでいましたね。
正式に入ってからは一日当たりの無料生成回数は減ったものの、有志により様々なchrome拡張が追加されたり、
要望にあった左下のAvalabロゴがもうちょっと小さくなってイラスト映えというか二次加工しやすくなったり、
モデレーターさんや管理人さんが専用discordサーバーで意見を飲み込んで実際に機能実装を行ったりと現段階では見違えるほどものすごい機能が追加されています。
①キャラクター対応
・従来通りのVroidHubからの登録
・VRMファイルを直接アップロードしてでの登録
・自撮り(写真とか)からの登録
・立ち絵等のイラストからの登録
・VCC拡張の「Avalab Toolkit for Unity」からのVRChatアバターの登録
ちなみに、ツールキットからのVRChatアバターでの登録方法は
②プロンプトでの生成
③生成精度
体感ではVRM等の3Dモデルアバターであればデフォルトは線が細かく繊細なイラストが生成できる感じでした。
自撮り画像についてはデフォルトでは本当にリアル寄りになるそうです、プロンプト次第でイラスト風に変更可能。
生成精度について話を戻しますが「立ち絵等のイラストからキャラクター登録」を行うと「イラストの画風に合わせたイラスト」が生成できます。
自分で描いたヘタクソなイラストもキレイに修正されて生成できるので構図等の参考資料になりとても良いですね!
3Dモデル等をスクリーンショットなどでキャプチャして立ち絵登録する方法もあります、正直言うと3Dモデルから直接登録するよりもイラスト生成する際に破城が少ないです。
カラーリングについては、キャラクターの衣装や髪、目の色や肌の色、装飾品の色まで特徴を吸い出し、他の衣装追加系プロンプトで生成する際にそのカラーリングを参照して作るようです。
ただ、あまりにも特徴的すぎる衣装に関しては、他の衣装プロンプトを捻じ込んでも反映されない場合があるそうです。
結果的に、下着のみのアバターやモロ出しなアバターで登録すると衣装追加プロンプト入力の際反映されやすいとかなんとか・・?
NSFW画像についても、普通に生成できるようです・・・SNS等に上げる際は気を付けてね・・・。専用サイトとかもあるらしいからそっちに上げるといいんじゃないかな。 ユーザーチャレンジ見てるとマニアックな性癖多すぎだと突っ込みたくなr
それだけ機能も追加されある程度ユーザーの規模が増えてきて、VRChatやバーチャルキャストなどで実際にAvalabで生成したイラストを展示するワールドが有志によって作られました。
とまさんがバーチャルキャスト版展示ワールドを作成してくれたり。
KsankiさんがVRhat版展示ワールドを作成してくださり。
Avalab管理人さんを交えての交流会も行いました!
Avalab展示ワールドに行けないけど見に行きたいよ~(><
そんな方向けに動画をいくつかご用意してあります!
↑こちらはギャラリーワールドの進捗情報提供時にKsankiさん自らが展示物を見せてくれた動画です。
↑こちらはついこの間突貫で作った私の動画、10月に入り一部イラストがハロウィン仕様に変わっていました!
↑こちらはお友達のYoutube動画編集者さんに頼んで作ってもらったワールド紹介動画。
本人曰く「納得のいかない出来」になったそうですがしっかりまとまっております。 同編集者の動画チャンネルのカレクラも是非見てね!(宣伝)
動画は以上です。
各ギャラリーワールドには生成数などのおまけがついたコードがもらえる場所があるそうですよ!!(動画でもチラっと見えちゃうけどゆるして)
この記事の執筆時点の今はぽんでろアバターのしなのちゃんがavalabとコラボして生成数がもらえるキャンペーンをやっているそうです。
上記のコラボキャンペーンは10月18日までだそうです、お早めにどうぞ!
まとめ
>>結局は最初の制御は人間の手で行うというのがAIではないのかという事でありました、その後にAIがAIを生成することも含めて・・・AI狂牛病なんて皮肉めいたワードもありますが。
AIに関連した専門用語も沢山ございますが深夜書き起こしからの朝の疲弊テンションで書き込んでいるため割愛させていただきます・・AIの研究たのしーよ!!!