見出し画像

「AIが顔を認識します」…これ、実際、どゆこと?

みなさん、こんにちは。(株)Laboro.AIの和田です。AI(人工知能)について、一般の方にとってもできるだけわかりやすくその中身や可能性をご紹介していくことを目指したコラム、2回目です。今回は、1回目のコラム(こちら)で、AIができることとして紹介させていただいた「認識」と「予測」のうち、「認識」にフォーカスを置いて、その内容と可能性を覗いてみたいと思います。

画像1

前回もお伝えしましたが、「認識」は人で言う五感に代わる分野だと思っていただくとわかりやすいと思います。五感は、ご存知の通り、視覚(目)、聴覚(耳)、嗅覚(鼻)、触覚(手)、味覚(舌)のことで、自分の周囲の状況を感知するために私たち人間や動物に備わった感覚です。私たちはこれらの感覚器を通して「○○さんがいる」「××の曲が流れてきた」というように、あるものの存在を認識することができます。

これと同じようなことがAIによって可能になってきているわけですが、これも前回お伝えの通り、AI(人工知能)の正体はアルゴリズムと呼ばれる計算式で、部品で言えば小さな半導体チップに記録されたプログラムでしかありません。「AI=ロボット」と誤解されやすいのですが、正確にはロボットに搭載されたチップ、しかもそこに登録されている計算処理プログラムがAIということになります。

AIブームともいわれる近年、日常的に『人の顔を見分けるAIが誕生!』のような宣伝文句を見かけます。ですが、AIを上のように捉えるとおわかりいただけると思いますが、チップやプログラムが目を持っていて物を眺めたり、耳が付いていて音を聞き取ったり…、そんなことはSFかオカルトの世界でしかあり得ません。「ロボット」や「システム」と書いてもらえれば頷ける気もしますが、わかりやすいキャッチコピーである一方、少し心地悪い感じがあります。

ではAIは、いったい何を、どうやって「認識」するのでしょうか。

画像2

計算式で表されているAIアルゴリズムが何かを認識するということは、やはりその対象も数値で表現されている必要があります。つまり、AIが人や物、音などを認識するという現象は、人と同じようにそれそのものの存在を認識するのではありません。対象となるものは、数値データに変換するための何かしらの演算処理が施されます。その数値をプログラムで処理してくプロセスが、「AIが認識する」ということになります。

具体的に、AIが認識対象とする代表的なデータを3つご紹介しますと、
 ①画像・動画データ(写真や映像など)
 ②自然言語データ(文字やテキスト情報)
 ③音声データ(声や物音など)
が挙げられます。

これらのデータが実際にどのような方法で数値に変換されるのか、大変興味のあるところですが、これをご紹介するとかなり難解になってしまうため他に譲らせていただき、ここでは、こうしたデータが数値変換されたものをAIは処理している、ということだけご理解いただけたらと思います。

(*下の図のうち時系列データは「認識」よりも「予測」で主に用いられます。)

スクリーンショット 2020-01-30 16.14.06

これらデータをAIが認識することによって、どのようなことが実現できるのでしょうか。


画像・動画データは、とくに近年の技術進化がめざましい分野です。例えば、顔の認識はその一例で、スマートフォンに搭載されている顔認証機能は身近な例として挙げられます。またビジネス分野で最近多く見られる傾向として、インフラや建設現場、製造現場など、物理的な作業環境や外環境でのAI導入が目立つようになってきました。とくに事例としても多く出てきているのが、建造物や製造物の劣化・異常箇所の検出です。傷やヒビといった損傷箇所を見つけ出すこの技術も、画像データを認識する手法がベースになっています。


テキスト情報を扱う自然言語データは、企業の業務効率化を検討する際によく用いられます。例えば、社内データベース上に散財する文書データから特定の文字や文章を認識し、一定のルールに基づいて自動分類するなどはその一例です。身近な例では、実はメールアプリの迷惑メールフィルターも同様の分野です。他にもインターネット上の情報を認識対象として、口コミを分析するといったことも可能になっています。


音声データとして挙げられるのは、例えば機械音です。工場機械の音を認識し、通常時と異なる音で機械が稼働していたらを危険を察知するといったAI活用が考えられます。また、いまや一般的になったALEXA(アレクサ)に代表されるスマートスピーカーは、音声認識のわかりやすい例です。ただ厳密に申し上げると、音声認識は音として認識する技術領域を指しますので、スマートスピーカーの場合は、音声認識に加えて言葉、つまり自然言語データも活用したAI技術と考えるのが正確です。

画像データ、自然言語データ、音声データは、人の五感で言えば、視覚(目)、聴覚(耳)に似た分野で、近年とくに研究・導入事例が多い領域です。一方で、嗅覚(鼻)、触覚(手)、味覚(舌)に当たる部分はこれらには含まれませんが、臭いの強さ、ものの硬さ、食べ物の甘さなど、数値的として捉えることができる感知センサーが用いれば、同様にデータとして取得・応用していくことが可能です。

異常検知

今回は、AIでできることのまず1つ目の領域、「認識」について簡単にではありますが、ご紹介させていただきました。

次回は、もう少しこの「認識」について詳しくお伝えするため、画像をテーマにして深掘りしていきたいと思います。その後に、もうひとつのAIでできること、「予測」についてお伝えしていく予定です。

今回もありがとうございました。


---ここから下は、私が務めるLaboro.AIのご紹介です----------

(株)Laboro.AIについて

オーダーメイドのAIソリューション「カスタムAI」の開発・提供を事業とする、AIスタートアップ企業です。アカデミア(学術分野)で研究される最先端のAI・機械学習技術のビジネスへの実用化をミッションに、業界に隔たりなく、様々な企業のコアビジネスの改革を支援しており、その専門性から支持を得る国内有数のAIスペシャリスト集団です。

Laboro.AI WEBサイト

画像5

----------------------------------------

*本文掲載の画像は当社制作もしくはflickrから引用しています。


この記事が気に入ったらサポートをしてみませんか?