見出し画像

「大規模言語モデルは新たな知能か」を読みました (読書ログ#4)

7/3に紙の本で購入したいたChatGPT関係の入門書を読みました。

TL; DR

  • 著者(岡野原さん)からも分かる通り、2023年上半期時点ではかなり信頼のおける入門書です(あとがきに書いてあるとおりPFNの社員さんも内容チェックしているらしく、信頼度が高いです)

  • LLM (GPT) の機能的な説明だけではなく、どういう使い道がありそうか?という話を読むだけでも (Chat) GPTブームの雰囲気を知ることが出来ます。

雑多な感想

全体として、とてもいい本でした。特に難しい数式なども出てこないので、サクサクと読み進めることができます。むしろ縦書きなので少し読みづらいぐらいです(例えばハヤカワ新書の方は横書きでした)。

目次を引用しておきます。

  1. 大規模言語モデルはどんなことを可能にするだろうか

  2. 巨大なリスクと課題

  3. 機械はなぜ人のように話せないのか

  4. シャノンの情報理論から大規模言語モデル登場前夜まで

  5. 大規模言語モデルの登場

  6. 大規模言語モデルはどのように動いているのか

  7. 人は人以外の知能とどのように付き合うのか

忙しい人は1章-2章と6章だけ読めばいいかもしれません。情報理論や言語モデルの話が出てくるのは著者っぽい感じがしました。計算機科学の人で言語モデルなどに詳しくない場合は5章あたりを読めばいいかも知れません。

私の感想としては、全体的にChatGPTの普通の入門書的な話も多いこともあり、若干重複感というか、回りくどさがありました。一般向けの入門書と考えるとこれぐらいなのかもしれないですね。

著者のサポートページも勉強になりそうです。資料もあるみたいですね。

少しブームが落ちてきたという話も聞こえてきますが、ChatGPT自体が2022-23年を特徴づけるキラーアプリの一つであることは間違いないと思いますので、興味があれば手にとって読んでみるといいかなと思います。

この記事が気に入ったらサポートをしてみませんか?