Parallel Real Virtuality Ⅰ
Realな私は大学でメディアの授業を担当していて、最新のガシェットやSNS等々、「Z世代の学生に負けるものか」と密かに対抗心を燃やしながら色々チャレンジしている。
例えばAI。iPhoneを使い始めた頃、ご多分に漏れずsiriに「何かおもしろい事を言って」とよくリクエストした。
amazonブラックフライデーで 2千円でゲットした echo show 5 は時計として使えるが、Alexaにはいつも天気を確認するのにお世話になっている。もともとスマートスピーカーとしてそれなりの音質で音楽も奏でてくれるが、学生の頃に良く聴いていた「風」の「海風」を聴きたくなってリクエストしたらなぜか「茶摘み」が流れてきた。「違う、違う、そうじゃない・・・」といろいろとツッコミ(質問を修正し)ながら、正しい「海風」に到達するのに四苦八苦した。
2021年、研究室の引っ越しをきっかけに過去の紙の資料等の大断捨離を断行した。その時に出てきたアルバム写真は10年ほど前にフォトスキャナーを使って一部をデジタル化していたが、まだ大量の写真が残っていたので走査スキャナーではなく撮影型スキャナーを調達し、残り全ての写真をデジタル化した。2000年頃からのデジカメで撮影した写真は、複数のハードディスクに分散していたので統合・整理し、あわせて5万枚をこえる写真を容量無制限の amazon photo に放り込んだ。
amazon photoには写真の中の人物検索AIが仕込んである。自分の顔を検索したところヒットした700枚余りの写真は、60代の最近の私の顔写真から遡り18歳の学生証の顔写真までを同一人物であると判定し抽出してくれた。
自分だけでなく、様々な人の顔写真を検索して遊んでみたが、若い頃ととても同一人物とは思えない顔でも同一人物として正しく判定し、集合写真の中からでもその人物を正しく見つけ出してくれてスゴイ。AI恐るべし。
生成AIを使ってみた
2023年2月、新たにICTをテーマとする教職科目を開講することになって、当時話題となった生成AI(Chat GPT 3.5)を試しながら授業スライドを作成した。Chat GPTに、(同姓同名がいない)私の名前を入力してみると、どうやら私は大手IT企業を築き上げた資産家だそうで、かみさんは有名漫画家だった。Char GPTが生成したVirtualな世界ではかなりセレブな生活ができるはずだが、残念ながら完全なるFake。Real世界の私はセレブとは程遠い・・・。現実(Fact)はそれほど甘くはないのである。
勤務する安田女子大学についても質問してみたが、「ぽいけど何か違う」という感じ。東京の財閥系同名学園の情報に引っ張られるようで、何度広島の大学だと主張(入力)しても、安田女子大学は安田財閥の創始者で東京の安田学園を設立した安田善次郎さんが設立した東京の大学であるという情報が修正される気配はない。
(注 使用したChatGPT 3.5は 2021年9月までのネット上の文書をあらかじめディープラーニング = Pre-Trained したAIなので基本的には最新の情報を反映しない)
一方で、5月ごろに google bard や他のAIにも「安田女子大学について教えて」と質問し、比較してみたがネット上の情報をもとにしたそれほど上手でない文章が出てきた。一方、ChatGPT 3.5の紹介文は学部構成等が微妙に違うものの、大学の紹介文としてはとてもよくできた魅力的な文章で、正しい情報に修正して大学のパンフレットにそのまま使えそうな感じであった。
後期にも別のクラスでの授業が予定されていたので、夏休みに、スライドをバージョンアップするために、画像系の生成AIも試してみた。大学でAdobeのアカウントを持っているのでFireflyを使用。最初に、63歳の時に撮影した職員証用の私の写真を入力し、「この人のもっと若いころを推測して」とリクエストしてみた。
生成された写真はこの写真。う~ん、何というか、Facebookのいわゆる「国際ロマンス詐欺」で女性に友達申請する詐欺師のプロフィール写真で使われていそうな感じ。
googleで画像検索してみても誰もヒットせず、似ている人もみつからない。amazon photoのAIもオリジナルと同一人物であるとは判定しなかった。
よく見ると鼻や目などオリジナルの韻を踏んでいるようにも見えるが、全くの別人が生成されている。「こんな人いるよね」と決してイケメンという感じではないがなんとなく魅力を感じるのは、ChatGPTの生成する文章の感じと共通する。
生成AIは、2010年代に急速に普及した deep learning の技術を使用しているが、最近のAIが使えるAIとして充実したのは、ネットインフラが充実し、IoTの時代となり deep learning のための餌ともいえるデータ(ビッグデータ)をネットを経由で容易に取り込めるようになったからである。
最初に Chat GPT3.5 を試したとき、大量にアクセスできる情報(=餌となる文書)がある質問については回答としての精度は高いが、私が資産家になってしまったように、餌が少ない場合の回答は実にいいかげんなものである。
学術論文ではその論文の評価の指標としてIF(Impact Factor)値が用いられる。IF値とは、その論文が他の論文に引用された回数をパラメータとしてその論文の価値を判断する。Chat GPTのような生成AIは、質問に関する文書データが多ければ回答の精度が上がるが、データが少なければその精度が下がるのかもしれない。
特に人物の場合、歴史的人物も含めて世界的に有名な人物はネット上に情報(餌)が十分にあるため精度が上がりそうだが、そうでない人はそれなりにという感じだろうか。学術論文の場合は引用数を「論文の価値」の指標にするが、生成AIの場合はネット上の情報量が「生成する回答の精度」の指標にになるのかもしれない。
画像生成AIであるFireflyから出てきた国際ロマンス詐欺師の写真をよく見ると目や鼻のパーツはオリジナルの写真の各パーツとよく似ているが、全体の雰囲気からして全くの別人が生成された。ただ、この人物、最初に詐欺師と断じてしまったのでそのイメージに引きずられるかもしれないが、そのイメージをリセットしてみると、なんとなく魅力的で、こんな俳優さんいたよね・・・・というような見方もできるかもしれない。
推測だが、人物写真を生成する場合、Firefly もネット上の写真等の画像を deep learning していると考えられるが、男性写真の場合ネットには俳優等の写真が多く存在するため、その要素の影響が強く出るのではないかと想像できる。試しに別の男性教員に顔写真を提供してもらい、自転車を漕ぐシーンの写真を出力させてみたところ、なかなかのイケメンが登場した。
さて、引き続き、AdobeのPhotoshopを使ったモノクロ写真のカラー化や、 Firefly に自分の若い頃の写真を読み込ませたら少女漫画に入り込んだ話、スキャンデータ由来の画像からイラストを作ってみた話し等々、生成AIで遊んでみた。その顛末についてはPart2以降に書いてみたいと思う。時間がとれるまでしばし休憩・・・
この記事が気に入ったらサポートをしてみませんか?