サラダを作る人、いいねと言う人

2023年3月15日 15:40

「ワードサラダ」という言葉がある。
コンピュータが生成する、文法としては正しいが使われる単語がでたらめな「一見それっぽいがよく読むと成り立っていない」文章を指す言葉だ。例えば以下のような。

フライパンのクモが発見されました。この携帯電話は、自分の渋滞生活の中で自然に教養を得ることができるユニークなものです。ネイティブスピーカーの談話を聞いて、それを繰り返すだけでなく、その場でサーカスや単語の意味を学ぶことができます。

このワードサラダ、一昔前まではインターネット上の大きな悩みのタネであった。
インターネット検索のアルゴリズムには「ページランク」という考え方がある。ユーザが検索した際、その検索ワードに関連度が高いウェブページを上位に表示させるために、あらかじめページにランク付けをしておく仕組みである。
ユーザにとって「有益な内容」が記載されているサイトから多くのリンクを集めているサイトを良いサイトとみなし高いランクを付与するのだ。

では、その「有益な内容」というものをコンピュータでどう判断するのかということだが、結論から言うと当時、コンピュータがそれを正確に判断することは困難だった。そのため、それっぽい文章がある程度の文量で書かれているサイトであれば、それは良いサイトであると大雑把に判定されていた。

この大雑把な判定が悪用されることになる。
一見それっぽく見えるがよく読むと中身のないサイトを大量に自動生成し、それらのサイトからランキングを上げたいサイトにリンクを貼ることで無理やりページランクを吊り上げるというお行儀の悪い手法が一部のSEO対策業者の中で横行したのである。
その結果、インターネット上に人間にとって無意味なサイトが大量に放流されてしまい、そういったサイトで検索結果が汚染されてしまう事態となったのである。
その時に不名誉にも活用されてしまったのが、冒頭で紹介したワードサラダを生成する技術なのである。

その後検索エンジン側の技術も成熟し、ワードサラダのような無意味な文章を検知できるようになったため、現在ではこのような手法は通用しないどころかむしろページランクを下げる要因 (*1) になっており、こういった虚構のSEO対策は消滅しつつある。

ところが 2022年、人間の目から見ても有用な文章を自動生成するサービスが登場した。それが Chat GPT である。Chat GPT は GPT-3 (Generative Pre-trained Transformer 3) という Deep Learning によるテキスト生成モデルを活用したチャット型サービスである。
対話欄に質問を記述し投げかけると、AIがそれに対する回答をチャットで返してくれるというものなのだが、その回答が人間顔負けなのである。

例えば試しに「Twitterでバズる投稿文を考えて。ネタっぽいちょっと笑える内容がいい。」と書くと以下のような内容が返ってくる。

以下は、Twitterでバズるかもしれない投稿文の例です。ユーモアやユニークなアイデアを含んでいます。

1. 「食べログで評価が高い店に行ったら、お金が高かった。俺の評価は「美味しかったけど、貧乏人にはおすすめできない」ということでした。」
2. 「最近、毎朝コーヒーを飲むと元気になれると思ったら、ただのカフェイン中毒になっていた。」
…

また例えば「検索汚染について200字程度でかいつまんで教えて」と書くとこのように返ってくる。

検索汚染とは、検索エンジン上で意図しない結果が上位に表示されることを指します。これは、スパムサイトやフィッシング詐欺サイトなどが、検索エンジンのアルゴリズムを悪用して上位に表示されることで実現されます。また、SEO（検索エンジン最適化）のために、無関係なキーワードを多用することで、本来の検索結果とは異なるページが上位に表示されることもあります。これにより、検索エンジンのユーザーは、意図しない結果に誘導されたり、有用な情報を見つけることができなくなったりすることがあります。

このように文章の破綻がないどころか、非常に有用な回答をもらえるのである。
また、2023年に入りにMicrosoftがGPTベースのAIを検索エンジンBingに搭載したことでこちらも盛り上がりを見せている。
ユーザ間でさまざまな試行がなされているがその中でもこの映画のプロットを書かせたものなどはかなり秀逸だ。

これはマジですごい。
本当にすごい。 pic.twitter.com/NIkMLLM6TN
— nakaya (@NeueHelvetica) February 16, 2023

現代のワードサラダは支離滅裂などではなく、理路整然としており語彙が豊富でウィットに富んだ文章なのだ。

もはやこのようなレベルの文章が自動生成されてしまうと、それが自動生成されたものなのか人間が書いたものなのか、機械的に判断することは不可能に思えるし、またそもそも、その判断をする必要があるのかさえ疑問に感じてくる。

件の例ではワードサラダが「有用でない文章」だったにも関わらず「有用な文章」として誤認されてしまったのが問題だった。
では、GPTないしこれからさらに発展するだろうコンテンツ生成技術が大いに活用され、人間にとっても有用なコンテンツが大量生産された場合はどうだろうか。果たしてそれが人が書いたものか否かを判別する必要があるのだろうか。

2013年、オックスフォード大学のマイケル・A・オズボーン准教授は「The Future of Employment : How Susceptible Are Jobs to Computerisation?」という論文の中で、10年後に機械に置き換えられてしまう可能性の高い職種・低い職種を発表し話題となった。この中で、クリエイティビティの高い職種は機械による置き換えは起こりにくいだろうと論じられていた。
この論文からちょうど10年目の2023年現在、ここで取り上げたGPTやお絵描きAIとして話題となったDiffusionモデルなどの登場により、これまで不可侵とされてきたクリエイティブな領域までもがコンピュータで代替されうる未来が見え始めた。
もはや創作は人間だけに許された最後の牙城では無くなってしまうのかもしれない。

では、人類に最後に残るのはどんな能力なのだろうか。それは評価する力なのではないか。
先ほどの ChatGPT に生成させたTwitterでバズる文章も、本当にバズるかどうかは最終的に「いいね」を押すユーザに委ねられるわけだし、映画の良し悪しも観客が感動するかどうかで決まる。
SNSやウェブ上のあらゆるコンテンツは今後、自動生成されていくことにはなるだろうが、それと同時に、それらが良いものかを判断するのは徐々に人間の仕事になっていくのかもしれない。

Tiktokでは投稿されたコンテンツが一定の再生回数に至るまでわざと別のユーザのタイムラインに登場させ、目に触れやすくさせるアルゴリズムが組み込まれているとされている(*2)。これはあえて目に触れやすくすることで人目による評価を意図的に行わせる目的が含まれていると考えられそうだ。

またYoutubeでは切り抜き動画という、主に生配信などの長尺動画から、面白い箇所を抜粋して再編集した動画を他のユーザが作成し投稿する文化がある。これも人目による評価とコンテンツの再定義を行って新しい価値を付与している例だ。

「良さ」とはなにか。「価値がある」とはどういう状態か。文化的な背景や目まぐるしく変化するミームに追従して価値観をチューニングし、一定の水準で評価を行う、いわゆる目利きをするためには、今の時代においてもまだ人間の方が精度が高いのかもしれない。

機械がおいしいサラダを作る時代になっても、「この味がいいね」と言って記念日を制定できるのは、今はまだ人間だけの特権なのである。

*1 Google は公式ドキュメントの中でスパムに関するポリシーを公開していが、その中に自動生成コンテンツに関する言及がある。

*2 Tiktokの詳細なアルゴリズムは公式には公開されていない。ただし市井の分析によりどうやらフォロワー数に関係なく数百再生程度は再生されるよう調整されているようである。

この記事が気に入ったらサポートをしてみませんか？