見出し画像

画像に関して

ChatGPTなど、AIがいつの間にか進化しており話題になっていますので、AIの進化について学んでいきたいと思います。

ChatGPT4も登場して、まさに「シンギュラリティー」と感じる方は、多いと思いますが、テキストによる自然言語処理と、音声処理に比べて、画像処理は、さらに難しさが上がります。

課題としては、
1.言語には正解があるが、画像はピクセルデータである。
2.画像はピクセルデータに意味がある。
3.画像には、「縦と横」の要素がある。
4.「画像分類」と、「画像生成」両方に課題がある。

ということかと思います。

ここで、AIが苦手な問題として、シンボルグラウンディング問題というのがあります。

シンボルグラウンディング問題とは

AIは、記号をシステム内のシンボルが、どのようにして実世界の意味と結びつけられるかわからに問題です。
人間は、「シマウマ」と聞くと、「シマ模様」の「ウマ」とわかるのですが、AIには、その概念がないため、「シマウマ」と言われても何かわからないという問題があります。

AIによる画像認識の進化に関して

画像認識の進化の歴史は、次のようになっています。

1990年代後半~2000年代初頭
最初の画像分類アルゴリズムが開発されました。これらのアルゴリズムは、手作業で特徴を抽出し、単純なパターンマッチングに基づくアプローチでした。

2010年代初頭
畳み込みニューラルネットワーク(Convolutional Neural Network)が登場しました。 CNNは、機械学習アルゴリズム自体が特徴を抽出することができるため、大きな注目を集めました。

CNN(Convolutional Neural Network)

2012年
深層学習の父と呼ばれるGeoffrey EHinton教授率いるチームの「AlexNet」
が、当時最大の画像認識コンペティションであったILSVRC(ImageNet Large Scale Visual Recognition Challenge ) で圧倒的な優勝を果たし、CNNによる画像認識の可能性を広く知られるようになりました。

その後、GoogleNet、ResNetなど、様々なCNNをベースとしたアルゴリズムが登場しています。

AIによる画像生成の進化に関して

画像生成で一番重要なのは、「GAN(Generative Adversarial Network(敵対的生成ネットワーク)」です。GANは、Generator(生成ネットワーク)Discriminator(識別ネットワーク)の2つのネットワークから構成されており、互いに競い合わせることで精度を高めていきます。要するにAI対決です。画像生成は最近話題になってきました。

GAN

画像AIの進化

画像認識AIの進化は、
 ①パターンマッチによる画像認識
 ②畳み込みニューラルネットワークによる画像認識
 ③深層学習による画像認識
画像生成AIの進化は
 ①敵対的生成ネットワーク
という進化となっています。

画像認識AIは、パターンマッチから、各ピクセルを演算し、深層学習によるアルゴリズムへ進化。
画像生成AIは、Generator(生成ネットワーク)とDiscriminator(識別ネットワーク)のAI対決というように進化しています。

精度と応用が重要

画像認識AI、画像生成AIの進化について学んだと思います。
画像に関するAIは精度と処理速度が重要になりますが、顔認識やがん細胞の発見など様々な応用があります。
また、画像生成AIは、話題の「DALL-E2」「Stable Diffusion」「Midjourney」など新しいものがどんどん出てきます。
積極的に画像AIを活用して様々な応用を考えましょう!!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?