ひょんなことで「インターネット恐るべし」を知る

横断歩道

○○の画像をすべて選んで

Webサイトにログインするとき、「私はロボットではありません」が表示され、その左側にチェックを入れると、「○○のタイルをすべて選択してください」と表示されることがある。表示されるのは道路だったり信号だったり、看板だったり建物だったり、千差万別だ。

グーグルが提供している「reCAPCHA(リキャプチャ)」と呼ばれる認証システムで、プログラムやボットによる不正アクセスを防ぐねらいがある。2007年にカーネギーメロン大学が研究開発した技術をグーグルが2009年に買い取り、5年後に実用化された。

当初は「私はロボットではありません」のチェックと歪んだ文字画像のテキスト入力だったのが、2017年に写真を選択させる仕組みに進化した。Webサイトへのログインで多用されるのはメールアドレス、ID、パスワードだ。ところがアルフェベットと数字の組み合わせなので、コンピュータに一定のルールを与えれば、成りすましやDoS/DDoSアタックが容易になる。イメージの識別可否でアクセスしてきたのが人かシステムかを確かめるのは、「なるほど」ではある。

毎日2億件のディープラーニング

リキャプチャが示す歪んだ文字や写真は何が元になっているのかというと、グーグルが収集したイメージでもなければシステムが生成しているのでもない。実は新聞記事や書籍の一部だという。ニューヨーク・タイムズの記事であったり、グーグル・プレイ・ブックスに追加される書籍だったりする。

つまりリキャプチャに示されるのはOCRで認識できなかった文字や画像で、認証プロセスを通じて、Chrome経由でWebサイトにアクセスしてくるユーザーに教えてもらっているというわけだ。ネットユーザーは知らないうちに、記事アーカイブや電子書籍の作成に参加していることになる。

だけでなく、実はネットユーザーはグーグルのディープラーニングに協力している(させられている)のだ。何せ全世界で毎日、リキャプチャが約2億件以上表示されているのだから、AIが育たないはずがない。

1日で4兆円近くを売り上げたアリババの「光棍節」(11月11日:独身の日)のアクセス総数は約9億件だったという。対してグーグルはOS、ブラウザ、メールなどを無償で提供し、毎日数十億件の利用を確保している。

メガプラットフォーマ対策が焦点

GAFA(グーグル、アマゾン、フェースブック、アップル)はもちろん、阿里雲(アリババ)、騰訊雲(テンセント)、金山雲(キングソフト)などに個人が真正面から立ち向かっても、とても太刀打ちできるものではない。売上高が兆円単位の超大手企業でも、ネット系メガプラットフォーマには敵わない。

AIだけでなく、魅力的なサービスを無償で利用させる代わりに、利用者の個人情報を根こそぎ持っていく。インターネットには国籍がないので、例えば日本で稼いだ売上高に見合う税金が日本に納められるわけではない。リキャプチャが教えるのは、「インターネット恐るべし」だ。

この記事が気に入ったらサポートをしてみませんか?