見出し画像

2022年度AIPシンポジウム成果報告会特別講演「大規模言語モデルの驚異と脅威」

はじめに

Twitterで、「大規模言語モデルの驚異と脅威」の講演が、素晴らしくよくまとまっているのでぜひ視聴してくださいとの「つぶやき」が流れてきた
講演は43分だが、簡潔でかつ必要十分な内容だったので
私の備忘録を兼ねて本noteに概要を記載しておきます

AIP(理化学研究所 革新知能統合研究センター)シンポジウム

本講演は、2022年度AIPシンポジウム成果報告会の特別講演として企画された。AIP成果報告会は、全ての講演のビデオとポスター発表のポスターが公開されているので、情報の宝庫。
時間のある方は、下のリンクをたどって、じっくりと時間をかけて勉強されると良いでしょう

特別講演「大規模言語モデルの驚異と脅威」

下記が、講演の動画になります

スライドを眺めるだけでポイントがよくわかります
以下、動画に登場するスライドを使用して概要を説明します

驚異的なスピード

たった4ヶ月でここまで普及・進化した

FY2022 AIPシンポジウム 特別講演
https://www.youtube.com/watch?v=PUuk4Cv-ycgより

言語モデルでそこまでできる驚異

言語モデルだけで本当に会話できるのか?
後述する学習により「理解」しているのではないか?

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

言語モデルが、次に来る言葉を選択する原理

最も出現確率が高い単語を選択しているだけ

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

言語モデルの問題

・単語列が長くなると出現確率が0になる
・「英国の首都」と「イギリスの首都」で出現確率に大きな差が生じる

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

nグラム言語モデル

n-1個前の単語までで出現確率を計算する
利点:出現確率が0になるのを回避できる
問題:例えばnが3だと、「英国の首都は?」の「英国」が消えるので「東京」の出現確率が最大になる。同様の事例が起きる

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

RNN型ニューラル言語モデル

単語ベクトルに、離れた情報を埋め込む
利点:離れた単語も探索に反映可能
問題:ベクトルが固定長だと情報を覚えきれない

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

深層学習にもとづく機械翻訳の登場

注意機構により翻訳精度が飛躍的に向上した

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

Transformer

機械翻訳の注意機構を言語モデルに導入した
利点:単語間の情報統合コストが距離に依存しない
並列計算になじむ

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

GPT

Transformerのデコーダ部を事前学習

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

ファインチューニング

事前学習モデルをタスクに合わせて調整(追加学習)する

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

プロンプト

ファインチューニングの代わりに入力するプロンプト(言葉の内容)を工夫する
利点:追加学習の必要がない
問題:タスクによってはファインチューニングより成績が低い

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

Instruction Tuning

複数のタスクでプロンプトによるファインチューニングを行う
62個のタスクをファインチューニングできた

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

Chain of Thought(思考の連鎖)

考え方を含めた指示を出す
利点:プログラムが順を追って思考し、正解にたどり着く

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

PlayGround

現在フリーソフトなので、試してみてください
(実際にアプリを立ち上げて実演してくれる)

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

人間のフィードバックによる強化学習

人間が評価したサンプルから評価方法を学習したアプリを用いて出力を評価する。これを繰り返して強化学習を行う。

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

驚異のまとめ

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

私のコメント:
2023年4月25日時点で、AutoGPTという、目標達成まで出力を自動で改善していくという
とんでもないアプリが現れています

大規模言語モデルの脅威

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

これから起きるであろう問題

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

大規模言語モデルを活用した論文の取り扱い

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより
FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

全体のまとめ

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

参考資料

FY2022 AIPシンポジウム 特別講演https://www.youtube.com/watch?v=PUuk4Cv-ycgより

おわりに

私は本講演を視聴することで、Twitteによく流れてくるキーワード
「RNNモデル」「Transformer」「プロンプトラーニング」「Chain of Thought」の理解が進みました

本講演内容を理解すると、以下のつぶやき集がよりいっそう
良くわかるようになります

私がリスペクトしている谷口忠大先生の以下の寄稿論文の理解の助けにもなります


本noteは私の備忘録ですが、自由に読んでください サポートは、興味を持ったnote投稿の購読に使用させていただきます