見出し画像

AIができること、超ざっくりまとめ:識別編【中学生にもわかるAIの話】

「中学生にもわかるAIの話」を読んでいただいてありがとうございます。


AIでできることを4つのジャンルに分けて、分類・予測と説明させていただきました。


AIでできることの4つのジャンルはこちら

・分類
・予測
・識別
・実行

ChatgGPTが考える「ファミリーコンピューター風の4つのエレメント」


そして、今回は「識別」です。

以前こちらの記事でコンピューターに目が発明された。といった内容を紹介いたしました。

これはディープラーニングと呼ばれるAI技術がきっかけで、大きくAIの時代が動いた瞬間でもあります。(詳しくは記事内で書いてます。)


さて、コンピューターに目? 識別?
いったいどういうことでしょう。


いまから10年ほど前に、アメリカでILSVRC (ImageNet Large Scale Visual Recognition Challenge)と呼ばれる画像認識コンテストがはじまりました。(2017年まで毎年開催)

ChatGPTが考える「ILSVRC のコンテスト風景」

コンテスト出場チームはディープラーニングを駆使して独自のAIモデルをつくり、大量の画像の認識精度を競い合う。というコンテストです。

世界で名が知れた大学チームや、日本からも東大チームが参加したり、Googleも参加したりして、画像認識の技術は年々高まり、この時期を経てかなりの精度となりました。

これがAIによる「識別」が発展した原点です。では、実際に識別はどんなことができるのでしょうか?


画像分類・画像認識(画像に何が写っているのかを当てる)


ChatGChatGPTが考える「猫を識別するAI」

猫の写真を見たコンピューターは「これは猫です」と答えます。犬の写真をみたコンピューターが「これは犬です」と答えます。超大量の画像を学習させることで時に、その精度は人間の目をも超えます。

例えばですが、画像に写っているのはトイプードル。

でもトイプードルらしいふさふさの毛並みではなく、雨の中で毛はずぶ濡れになり、ぱっと見でトイプードルとわからない。

ChatGChatGPTが考える「ずぶ濡れのトイプードル」

そんな時でもAIは大量の画像から得てきた特徴をもって「トイプードル」と見事的中させます。学習して精度が高まったAIを駆使すれば、その正解率は98%、99%にもなり得ます。

みなさんはこの上の画像をみて100人中何人がトイプードルと言い当てられると思いますか?


物体検出(画像内に写っているモノを見つける)

先ほどの画像分類・画像認識で「何が?」を実現できるようになりました。次は「どこに?」の実現です。

画像の中にある特定のテーマを見つける。それが物体検出です。

例えば以下の画像のように、市街地を走る車を特定し、囲んで表示させたりできます。

ChatGPTが考える「市街地での車の物体検知」

これら2つの識別機能(分類と検出)を組み合わせるとこのようなことも可能になります。

①車を認識
②車のナンバープレートを検出
③ナンバープレートの情報を認識

ChatGPTが考える「車両認識とナンバー情報の検出」


逃走中の車の特定や、混雑状況の把握、駐車場の空き状況の可視化など車ひとつとっても様々な活用が見えてきます。


いままで紹介してきた予測や分類はどちらかと言えば、データをAIでどのように扱うか?といった少し利用シーンが限定的なものではありました。もっと言えば、パソコンやコンピューターを使った室内での業務に使われていたAIでした。

しかし、識別というAIの登場により、屋外などのリアルな世界にAIが活躍できるシーンが増えてきたのです。

この分野の発展はコンピューターの目の進化そのものであり、「今のAI時代」の扉を開いた大きなきっかけでもあります。そこからAIはさまざまな分野に活躍の場を広げ、多様な使われ方が生まれて行きます。


その話はまた別の機会に