見出し画像

『BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門』 が発売になります。

BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門』が発売になります。

今回の表紙絵は、人工知能を使って描いてます。


この本は、「人工知能」による「自然言語処理」「画像処理」「音声処理」を実践するための入門書です。

対象読者は、
・人工知能によるプログラミングをはじめたい人
・人工知能による最新の自然言語処理を学習したい人
・人工知能でチャットボットを作りたい人
・人工知能でテキスト生成、画像生成、音楽生成を行いたい人

です。


現在、第3次人工知能ブームのまっただ中です。囲碁の世界チャンピオンに勝利したり、車の自動運転を行ったり、人工知能が活躍するニュースがたくさん報道されています。そして、ここ数年で最も急速に進化してる人工知能の研究分野が「自然言語処理」になります。


自然言語処理」とは、私たちが日常的に使う言語をコンピュータで理解できるようにするための処理のことです。知りたい事柄をテキスト入力することでWEBサイトを表示してくれる「検索エンジン」や、雑談の相手をしてくれる「スマートスピーカー」、英語のニュースサイトを翻訳してくれる「翻訳アプリ」など、私達の身のまわりは、「自然言語処理」であふれています。

画像2


人工知能による自然言語処理で、はじめに大きく注目されたのが、2018年にGoogleが発表した「BERT」になります。曖昧さを持つ言葉の理解は人工知能には困難と思われていた中、自然言語処理のベンチマークにおいて人間のスコアを上回りました。2019年にOpenAIが発表した「GPT-2」は、人間が書いたかのような自然な文章を生成できることを示しました。悪用が危惧され、論文公開が延期されたことでも話題になりました。そして、2020年には発表された「GPT-3」は、「GPT-2」の117倍もの大きなパラメータを持ち、自然な文章を生成するだけでなく、「翻訳する」「要約する」といった言語による命令をあたえるだけで、そのタスクを実行できることを示しました。

さらには、人工知能による自然言語処理のアルゴリズムを応用して、「画像生成」や「音楽生成」を行うことも可能になりました。2021年にOpenAIが発表した「DALL-E」は「大根の赤ちゃんのイラスト」のような説明をあたえると、そのキーワードから想像したイラストを描き、2020年に同じくOpenAIが発表した「Jukebox」はアーティスト名や歌詞をあたえると、その人が作曲したかのような歌付きの曲を生成します。生成したい画像や音楽を自然言語で操れるようになってきました。

画像1


この本では、次のような最先端のフレームワークを紹介します。これら開発フレームワークを使うことで、最先端の人工知能研究者が発表している最新の学習アルゴリズムを、そのまま活用することができます。

・自然言語処理:GiNZA、Huggingface Transformers、BERT、GPT-2、T5、GTP-3
・画像処理:Vision Transformer、DeiT、CLIP、Image GPT、DALL-E、BigSleep、DeepDaze
・音声処理:Tacotron2+WaveGlow、NEUTRINO、Jukebox

さらに、「Google Cloud Platform」(GCP)による自然言語処理のクラウドサービスについても紹介します。


この本が、人工知能のプログラミングをはじめる人の手助けとなり、より多くの分野で人工知能を活用するきっかけとなることを願っています。



この記事が気に入ったらサポートをしてみませんか?