見出し画像

IT初心者向け!AIは魔法じゃない!

こんにちは。石川@Forest編集部です。
2022年に疾風のごとく登場したChatGPT。みなさん利用していますか?
日常会話から専門的な質問への回答まで淡々とこなすChatGPT先生を前に、AI技術のレベルはもうここまで来たかと戦々恐々しております。
というわけで、今回はAI技術について簡単に紹介してみようと思います。

AIとは何か

一言で表すとこうだ!といきたかったのですが、実はAIという言葉の定義は曖昧だったりします。
AIはArtificial Intelligenceの略なのですが、人工知能と訳されるように、なんとなく”人のように振る舞うロボット”のイメージがありますね。
筆者は某回転寿司店にて健気に働くPepper君のイメージが強いです。

そもそも、AI自体の歴史は深く、1956年まで遡るそうで、現在に至るまで様々な研究が行われてきました*。
技術が開発されては、限界点に到達し、また新たな技術が生まれ……といったようなサイクルを経ているわけです。
その中でも現在のAIブーム(第三次AIブームと呼ばれているそう)の火付け役となった技術が「ディープラーニング(深層学習)」です。

*AIの詳細な歴史については、総務省「情報白書通信」をご覧ください。

ディープラーニング

ディープラーニングとは「大量のデータをコンピュータに学習させることで、特徴を見つけ出す技術、学習方法」です。これだけでは何のことやらだと思いますので、実際の活用例を見てみましょう。

農地やWebサイト、倉庫等など、業界問わず様々な場所で活用されていることが見受けられます。
その様な背景もあり、今日において、AI技術の理解と適切な活用が求められています。
ディープラーニングを用いたタスクは、画像認識、自然言語処理、音声認識、異常検知などと多岐に渡りますが、本記事では画像認識、自然言語処理について簡単に紹介します。

画像認識

ディープラーニングの定義に合わせて説明すると、画像認識とは、「大量の画像データをコンピュータに学習させ、画像の特徴を抽出、活用する技術」です。

以下の画像をご覧ください。

トイプードルが、どこか一点を見つめていますね。
トイプードルが写っていることを人が瞬時に判別できるのは、トイプードルが持つ特徴の検知、記憶の参照といったフローを無意識に行っているからだと考えられます。

同様のことをコンピュータにもやってもらおう!という発想が、ディープラーニングという技術の根本にあります。
大量の画像データをコンピュータに学習させることで、目や耳、足といったトイプードルの細かい特徴を認識できるようになるわけです。

画像認識にも様々な分野がありますが、基本的な考え方は上記の通りで、学習を終えたコンピュータ(AI)は、画像データから特徴を抽出し、画像に写る物体の種類や位置を、まさに人の様に推測します。
画像に写る物体を推測する技術は物体認識、種類だけでなく物体の位置まで推測する技術は物体検知と呼ばれ、自動運転にも利活用されています。
他にも人間の骨格を推定する姿勢推定や、画像のピクセル単位で種類を推定するセグメンテーションなど様々な研究がおこなわれています。

学習方法についても、物体認識を例に簡単に解説します。
大量の画像データをコンピュータに学習させると記載しましたが、詳細には画像データと、画像に写る物体の情報(正解ラベル)をセットで学習させます。
コンピュータは画像データの情報と、正解ラベルを照らし合わせ、徐々に学習を進めていきます。
(具体的な仕組みは微分や線形代数といった数学の知識が要されるため本記事では割愛しますが、是非調べてみてください。)

画像データは一般的なデータと異なり、空間情報を持つため、データ間の関係性も考慮しなくてはならない点に難しさがありました。
しかし、ディープラーニング技術の発展により現在では非常に高い精度で認識、推測することが可能となっています。

BTCでの画像認識活用事例

昨今の画像認識ブームに乗り遅れることなく、BTCでも画像認識に関する開発を行っております。
2020年には、顔画像から年齢を推定する画像認識モデルを開発し、世界的学術論文の成果を上回ることに成功しております。
専門的な用語が含まれていますが、ぜひご一読ください。


自然言語処理

「普段、人が使用する日本語や英語といった自然言語をコンピュータに学習させ、その特徴を見つけ出す技術」のことを自然言語処理と呼びます。
ChatGPTも自然言語処理を用いた技術の一つで、大量の文章データを学習することで自然な対話を実現させています。

言葉の意味だけでなく、文章構造、文脈を正しく理解する必要もあるため、画像認識分野よりも複雑な技術が要される分野です。
AlexaやSiri等の身近な音声サービスにも採用されている技術ですので、普段の生活から意識してみると面白いかもしれませんね。
また、画像認識技術と組み合わせることで、画像の説明文を出力したり、読唇術を行ったりと活用の幅もぐんと広がります。

最後に

今回はAI分野の技術について紹介しました。
本記事を通して、少しでもAIへの興味が湧いていただければ嬉しい限りです。
簡単なAIモデルであれば、PC一つで構築することができるため、ぜひチャレンジしてみてください!

BTC公式note、Forestでは、加速的に成長・変化し続けるBTCの源泉である社員、根付いているカルチャー、採用関連情報・イベントなどを紹介していきます!
noteは非会員でもスキ!できます。励みになるのでぜひ♡押してください!

Twitterも開設しています!これまで投稿した記事の中からおすすめのものを定期的に発信したり、そのほか役立つ情報を投稿する予定です。

この記事が気に入ったらサポートをしてみませんか?