AIの画像認識最前線

maito

2020年11月29日 04:01

Webシステム開発企業に勤めるmaitoです。

私のnoteでは、スマートシティやAI、VR、AR、MR、XR、ドローンなど

に関わるテーマを扱います。

成長産業となりうる分野の知識を身に着けて、

自分のビジネスにも活かしていきたいと思っています。

今日のテーマは、こちらの記事です。

◆画像認識技術の活用例

　これまでに、実際に活用されてきた画像認識技術の事例として、

　・防犯　→　犯罪者データベースから防犯カメラの映像との照合

　・医療　→　レントゲン画像から異常所見を検知

　・スマホ　→　SnowやSnapChatなどの写真・動画加工アプリ

　・製造業　→　生産ラインにおける部品の異常検知

　・農業　→　野菜の色味やヘタなどから適切な収穫時期を判定

　など、あらゆる分野において画像認識技術が普及しています。

◆画像認識技術の仕組みって？

　そもそもどんな仕組みになっているのか。

　基本的には、ビックデータを活用して、数千～数万、数十万、数百万の画像データを入力し、どこが顔の輪郭であり、目・鼻・口・眉・耳・髪などのパーツであるか、正解を与えます。

　その繰り返しを行うことで、認識の精度を上げていきます。

　AIは、人が視覚的にとらえる情報を数値として理解するので、画像をピクセルに変換し、RGB要素（色素）を把握し、0と１のバイナリなデータに変換して、特徴を数値で把握します。

　より詳細な仕組みや計算の流れ、プログラミングに関しては専門家の方にお任せしますので、ここでは割愛します。　

◆画像認識技術の応用

　画像認識技術を応用した技術として、GAN（敵対的生成ネットワーク）という技術があります。

　はじめに、画像認識技術で「人」という概念をAIが学習し、実在しない「人」の顔写真を生成します。

　次に、生成された顔写真を別の認識用AIがデータとして取り込み、それが「人」であるか否かを判定します。

　画像を生成するAIと認識するAIを互いに競わせることで、より精度高く、「人」の顔写真を生成できる能力が高まります。

◆画像認識技術のビジネス活用

自然言語処理という技術を組み合わせると、発している言葉から喜怒哀楽を認識することができます。

画像生成技術と自然言語処理技術を組み合わせると、

・ゲームのキャラクターに発言内容を設定して、適切な表情を表現する

・顔出しを避けているYouTuberが、イラストを設定して、声を流せばキャラクターが表情豊かに紹介してくれる

・病欠のアナウンサーの顔写真をipadなどに表示させ、原稿を流すだけで表情を変えながらニュースの紹介をさせる

などの利用が可能です。

身近な例だと、

・社員証を持たなくても顔認証で通過できる（パナソニック）

・籠の中の商品を認識し、合計金額を算出する（ユニクロ、GU）

・表情豊かに会話しているVTuberのキャラクター

などがあります。

例えば、メンタリズムや心理学といった学問を導入することで、

人が認識するよりも高精度に様々な情報を判定できるようになったり、

細かい機微をAIが認識してくれることもあるかもしれません。

スマートグラスのような形で商品化できれば、

女性が悪い男に引っかかったり、情報弱者が詐欺師に引っかかることも

なくなるかもしれません。笑

◆AIの画像認識最前線まとめ

　今回は画像認識について、トピックを踏まえつつ紹介しました。

　画像認識はAIが得意な分野の一つであり、すでにいろんな場面で活用されている技術ですが、

「何に活かすのか？」

　アイデアを提案できる人が重宝される時代になってきます。

　「○○ × Tech」というAIの技術との組み合わせが、新たな変革をもたらすきっかけになると思うので、ぜひ自分の業態との組み合わせを考えてみてください。

　毎日投稿するので、お時間ある方はお付き合いください^^

　ではまた。