第008話　AIの活用

2022年11月17日 10:39

昨今、AIを活用したサービスが次々に発表されています。おそらくみなさんもニュースやSNSで見かけたことがあるのではないでしょうか。例えば、AIが自動応答するチャットボットや文章作成などが有名で、最近では絵を描くものがにわかに話題を集めています。このようなものも含めて、現在、AIの利用における主要な技術はこちらです。

・文章生成
・文字認識
・画像認識
・画像生成
・音声認識
・音声合成

◆文章生成
現在、最も一般的に認知されている分野です。AIを活用することによって、さまざまな文章を自動的に生成することができます。AIは、ユーザーが書いた文章やキーワードから「文章の続き」や「新しい文章」を生成します。AIが文章を作成できるのであれば、ブログの記事や小説、ニュースなどのライティングはAIに任せればいいような発想もありますが、あいにく万能ではありません。挨拶文や履歴書、議事録などのような文章の構成に一定のルールや定型句のパターンがあるものを生成するには適していますが、専門的な内容や時事ネタの生成には、まだまだ進化が必要です。

◆文字認識
ポピュラーな例としてはOCR(Optical Character Reader)です。OCRはプリンターやスキャナーなどの機能として広く普及しており、紙に記載された文字を認識して、文字データに変換することができます。この機能にAIを付加することで文字の認識の精度をアップ。例えば、さまざまなひとが書いたクセのある手書きの文章をしっかりと認識、文字データに変換することができます。

◆画像認識
文字通り被写体を判別します。AIの機械学習と呼ばれる部分の進化によってもっとも恩恵を受けていると言っても過言ではありません。画像認識を使用している身近なサービスとしては、顔を認識して写真画像の加工ができるカメラ系アプリがあげられます。他には、これから普及されるであろうものとして「(商品の形状を判別して決済する)無人レジ」「医療分野でのレントゲン画像認識」など生活圏での活躍を期待されているものがあります。

◆画像生成
最近、次々と発表されているもっともホットなAI活用です。膨大なデータを使って学習したAIは、さまざまなものの特徴を把握し、実在するものをベースにして実在しない画像を生成します。この技術の応用によって「文字から画像を生成」「モノクロ写真をカラーに変換」などを可能にします。

◆音声認識
AIを活用することでさまざまな音声を認識することができるようになりました。スマートフォンや住宅家電にも応用され、音声で電子機器を操作したり、直接、デバイスを操作せずに情報を検索することができたりします。少し前までは、マスコミが取材やインタビューで音声を録音。別途、音声を再生しながら文字をおこす作業を行っていましたが、現在は音声をリアルタイムで認識、識別をしてテキストデータに変換したり、録音データをまとめてテキストファイルにしたりできます。複数言語の会話の翻訳もこの音声認識の応用です。

◆音声合成
テキストデータから読み上げ音声をつくる技術です。近年、単に読み上げるだけなく。音声のクオリティーが格段にアップしています。ディープラーニング技術の進化によって、一昔前のあたかも合成された音声のような音質からより人間らしいものに変わっています。実在する声優などの声をAIが学習すれば、声の持ち主と同等の音声でさまざまな発話が可能なところまで進歩しています。

ここまでAIの主な技術をご紹介しましたが、現在、私たちは「文章生成」「画像生成」のAI研究に注力しています。このうち次回からは、AIを活用した「文章生成」について、私たちrinnaの社内ツールやみなさんも手軽に利用できるスマートフォンアプリ『キャラる』を使った「文章生成」や「実例」を配信します。

第008話 AIの活用

第008話　AIの活用