見出し画像

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - Googleの猫

2012年、Googleの画像認識技術が飛躍的に向上することを示唆する、重要な事件が起きます。それは、「Googleの猫」と呼ばれています。Googleの画像認識プログラムが「猫」の画像を認識することに成功したということなのですが、いったい何が凄いのでしょうか。これまでの画像認識との違いを見てみましょう。

「Googleの人工知能が猫を認識した!」

2012年、Google社が開発した画像認識プログラムによって、猫の画像の認識に成功したというニュースが大きく取りざたされました。画像認識プログラムにYouTube上の動画から取得した縦横200ピクセルの画像1,000万枚を読み込ませたところ、その画像認識プログラムが猫の画像を認識できるようになったとのことなのです。
 当時、私は何が凄いのかさっぱり解らず、「猫なんて二歳児でも認識できるのに」と否定的な気持ちで受け止めていました。

「Googleともあろう企業が、二歳児以下の人工知能を作って騒いでいる」

あれから7年。
私はGoogleやその他の企業が開発した画像認識APIを利用したプログラムを、いくつも開発しています。
その画像認識技術は、画像に含まれる文字のみを認識してテキストデータを抽出したり、そもそもこのの画像は何なのか、はたまた画像に写っている人は楽しそうか、などといった、さまざまな情報をなかなかの精度で認識してくれます。
2012年に猫を認識した画像認識プログラムは、あらかじめ「猫」というものがどういうものかどうかを教えられることなく、自分で「猫」を理解しました。多くの画像のなかから猫の特徴を認識し、初めてみた猫の画像であっても猫だと認識できるようになったのです。もっとも、それは二歳児でもできますが、コンピューターであれば大量の画像を一度に読み込ませて分別することができます。犬と猫の画像を人間がやるよりもはるかに高速に分別できるのです!!


あまり凄さを感じませんが、プログラムを開発する立場から言えば、その情報がデジタルな情報として受け取れるというのも利点です。
また、私はMicrosoft社のクラウドサービスであるOneDriveを利用していますが、そのOneDriveの画像認識では、人の顔を認識して個人別に分類したアルバムを自動で生成してくれます。その認識精度はかなり高く、私のOneDriveには私の子供がまだ一歳の頃の写真から現在の中学生の写真まで、しっかりと同一人物だと認識しています。それは、人間よりも正確といえるのではないでしょうか。その自動生成されたアルバムを見ると、個人別の成長の過程がよくわかり、非常に重宝すると同時に恐怖すら覚えます。
 この画像認識、および最近流行りの人工知能の背景は、「ディープラーニング」(Deep Learning:深層学習)という技術が利用されています。
人工知能のブームは、これまでにも何度かあり、今回のブームが「第三次人工知能ブーム」と呼ばれています。
 さて、まずはこれまでの人工知能ブームとのその背景について、次項よりみてみましょう。

・2012年、Googleの画像認識プログラムが「猫」の画像を事前学習なしで認識できるようになった
・この技術は、「ディープラーニング」(Deep Learning:深層学習)と呼ばれている
・昨今の人工知能ブームは、この「ディープラーニング」によってもたらされている

よろしければサポートをお願いします!サポートで頂いた費用は、コンテンツのための設備費等のために使わせていただきます!