見出し画像

「私はロボットではありません」の天才的発想

サイトに新規アカウントを作成する際などによく見かける、「私はロボットではありません」という質問をあなたは見たことがありますか?

これは、Googleから提供されている、reCAPTCHAという仕組みで、プログラムで大量にアカウントを作成されたり、フォームなどに大量に書き込みをされないようにするものです。

少し前までは、読み辛い文字がいくつか出てきてました。最近は道路標識の写真を選ばされたり、タイル状の写真から車の部分を選ばされたりしますよね。この、ちょっとだけめんどくさい仕組みが、スパムなどの悪意あるプログラムからサイトを守っているのです。

そして、あまり知られていないかもしれませんが、この仕組みには天才的発想が隠されているのです。

本の文字データ化に役立っていた

少し前のあの読みづらい文字を入力していたのは、実は本の文字データ化に多大な貢献をしていました。本をスキャンし、OCRにかけて、本を文字データに変換していきますが、古くなり物理的に劣化している本などはコンピュータだけでは、識別しきれない文字がありました。

これを「私はロボットではありません」と答える人間に実施してもらったのです。コンピュータが読み取り切れない文字でも、人間であればかなりの精度で読む事ができます。これを利用したのがreCAPCHAの仕組みだったのです。

詳細は以下のTEDを見てください。僕は最初にこのTEDを見たとき、この仕組みの鮮やかさに感動しました。

次はAIだ

最近は、文字の入力はめったに見かけることがなくなり、代わりに道路標識や車の画像を選ばされます。

これは、「WebへのアクセスがPCからスマホになったことによって、文字入力が面倒になったから。」という側面もありますが、僕はAIの学習に、大量の答え付きのデータが必要になったからだと考えています。

最近何かと話題のAIやDeep Learningには大量の教師データが必要です。教師データとは、この画像は「車」の画像です。この画像は「ねこ」です。など答えと画像がセットになってるデータのことです。

AIの一種である、Deep Learningはこの大量の画像からパターンを認識、判別して、新たな画像を読み込んだときに、そこに何が写っているか理解することが出来るようになります。このときの理解の精度は、どれだけ大量の画像を学習させたか、にかかっているのです。

つまり、その大量の答え付きの画像が世界中の人々がアカウントを作るたびに、生まれているのです。その数は膨大なものになるでしょう。その大量のデータを学習させることによって、Googleの自動運転プログラムの精度は上がっていくのです。

実際にGoogleの関連会社である、Waymoは世界トップクラスの自動運転プログラムを開発しています。

まとめ

今後、AIを発展させるためにはこの「教師データ」をどのように大量に集めるかが、焦点となります。単なるデータはカメラやセンサーによって、集めてくるのが容易になりました。

しかし、そのデータが何を示しているのか、そのデータの意味を教えることが出来るのは今のところ、人間だけです。AIはデータを読み、着実に成長していきます。

「私はロボットではありません」

これを証明するためのタスクをこなすほど、人間は人間であることを証明することが難しくなっていくでしょう。数年後、数十年後、私達人間はどのようにロボットでないことを証明しているのでしょうか。


この記事が気に入ったらサポートをしてみませんか?