見出し画像

知能とは画像である

Deep Learningは現在様々な領域・分野で使われようとしている。しかし、もっとも安定的かつ強力に使える領域は、2018年2月現在、画像処理に関することと言ってもいいだろう。

静止画像から何が写っているかを当てる一般物体認識問題では、既存手法の性能を大きく超えるどころか、人間の認識能力すらも超えている。通常の画像に限らず、将棋や囲碁といった問題、果てには言語処理といった本来は画像処理ではないと考えられていた問題ですら、現在は画像認識の問題に変換して Deep Leaningで解決し始めている。

突然なのだが、大学の授業や日々の業務でグラフを作成する人は多いだろう。我々が常日頃見ている画像、つまり眼に映る通常の映像、の縦軸と横軸は当然「距離」だ。ところがグラフを作る時の縦軸や横軸は金額や時間だったりと、もはや距離となんの関係もない。すでに完全に情報は揃っているのになぜ我々はグラフを作るのか。つまり「画像化」するのだろうか?

人間はなにが楽しくてグラフを作るのか

結局、画像とは縦と横に近い関係のものが何かしら強い結びつきがある状態のことだろう。逆にホワイトノイズみたいな画像からは我々はあまりうまく情報を処理できないのだ。我々、そして Deep Learningは、相当に複雑な事象も2次元の画像化することでかなりうまく扱えるようになるのだ。

将棋や囲碁が人間にとって面白いと感じられる理由にちょっとした仮説を私は持っている。それは、逆説的かもしれないが、それらの問題を画像処理の問題として解くことができるからだ。人間も Deep Learning と同じく、他の機械学習の手法と比べると、はるかに画像処理の問題が得意だ。だから画像処理の問題として解決できる将棋や囲碁が好きなのかもしれない。

この記事が気に入ったらサポートをしてみませんか?