生成と評価とチューリングと
コンテンツの自動生成や評価についてもう少し考察してみたいと思います。
なんらかのビジネス的目的が存在する場合、自動生成を実現するには「生成」と「評価」が常にセットで実装されていないと機能しません。
無限に生成できる生成器だけでなく、その中から目的を果たし得るコンテンツをフィルタリングする評価器(分類器)が存在して初めて、自動生成が達成されます。
一定の水準で生成が可能となった今(もしくは近い未来)、より難しい問いとなるのは、この評価器(分類器)の方になると考えられます。
2023年現在、生成と評価の両輪が(人間の介在なしに)高いレベルで機能している分野は、Web広告でしょう。
自動生成された広告は「クリック率」という評価を通して、即座に評価されます。この学習を通して、クリック率の予測器を作ってしまえば、生成と評価(=予測)を同一の環境の中で高速に行うことができ、「クリック率の高い広告」を高精度に自動生成することができます。
これは、Web広告の露出量が多く大量のABテストが可能であること、クリックという明確な評価が 即時 行われるという性質に依るところが大きいです。
さて、ここで、チューリングテストの話をしたいと思います。
この、チューリングテストの概念はまさに生成と評価の話と繋がります。
Web広告の例で言うと、クリックの予測器は人間のクリック意向を「模倣した」機械であると捉えることができます。
アラン・チューリングはイミテーション・ゲームについて、以下のように述べます。
このチューリングの考察は、現在の「自動生成」を取り巻く環境、そして課題を明快に表しているように感じます。
現在機能する「評価器」は、チューリングの言うところの「表層」と考えることができます。
例えば、広告のクリックは、(人間の深いレベルの思考や心理変容を挟まない)「反射」に近いレベルの反応、と言えます。
Webの世界にいると忘れがちになりますが、本来、何らかのコンテンツに対する反応は「①刺激→②心理変容→③行動」と変化するはずで、Web広告で言うと「①広告を見る→②買いたい(見たい、行きたい、..etc)と思う→③広告をクリックする」となります。
しかし、Web広告においては、せいぜい1秒程度の(瞬間的な)接触でクリックするか否かを判断しており、刺激に対してほとんど②をほとんど挟まずに反応する、本能レベルのもの、と考えることができます。これは、チューリングの言うところの「表層的」な反応と言えるでしょう。
逆に言えば、データの取得が可能である①と③のみで説明ができる行動(=「表層的」であるもの)、刺激に対して反応までの速度が短いものは模倣が可能であると考えることができます。
では、玉ねぎの内側の皮の反応はどのようなものでしょうか。
「本当の心(real mind)」の反応と言えるのは、例えば、「感動」などが当たると自分は考えています。
音楽や映画を鑑賞した時の深い感動。これは非常に人間的なものであると思います。
さて、この「感動」は、模倣することができるのでしょうか。さらに言うと、人間の反応を模倣した評価器を作ることができるのでしょうか。
問題は、人間的であればあるほど(玉ねぎの内側に行けば行くほど)、「①刺激→②心理変容→③行動」における②の割合が高まる、という点です。
いい音楽を聴いた時、「感動」という②心理変容があっても、③行動のレベルまで落ちない、もしくは人それぞれ行動を示す、のではないでしょうか。
人間の反応を模倣する機械に音楽を聞かせても何も反応(行動)が返ってこないことが考えられます。
玉ねぎの内側に訴えるようなコンテンツの本質的な「質」は、模倣機械を作ることができるのでしょうか。
興味深いことに、チューリングは、さらに以下のように続けます。
コンテンツの本質的な「質」を評価するためには、人間をどこまで「機械的」であるかを定義することと近いかもしれません。
最後に、チューリングとある意味で真逆のアプローチで研究を進めた岡潔の思考を引きたいと思います。
参考:数学する身体:森田真生, 2018
この記事が気に入ったらサポートをしてみませんか?