AI時代の生存戦略．chatGPTとダブルハーベストループ.

2023年2月21日 00:01

言いたいこと

基盤モデルの発展によって，サービスを用意に作ることが可能に！
ChatGPTの学習に使われるRLHF(人間の評価を使った強化学習)は複雑なタスクを実現可能に！
ハーベストループを回して最強AIを作ろう！

はじめに

基盤モデルの登場によって，世の中が大きく変わりつつある．
stable diffusionのオープンソース化によって，Midjourneyやにじジャーニーをはじめとした数多の画像生成AIサービスが生まれた．
また，chatGPTの登場によって，質問応答や，チャットボットなどの対話システムの構築，文書要約や小説生成に至るまで，テキストを扱うタスクが全て容易にこなせるようになった．これまで個別にモデルを構築して学習してきたタスクが，大規模言語モデルに置き換わりつつある．
「いや，chatGPTは事実に即した正確な応答ができない！」という人もいるだろうが，それを補うためのprompting手法(Chain of Thought)や，web検索を併用した手法ReACT ，さらにCoT・ReACTを容易に使用するためのpythonライブラリ「LangChain」も開発された．言語モデルの発展と，言語モデルを活用したアプリケーションの進化は日々進んでいる．

2023年2月17日，松尾豊さん（東京大学教授），安宅和人さん（慶應大学教授）による自民党の「AIの進化と実装に関するプロジェクトチーム」に対する発表も，世間に大きなインパクトを与えた．
まだ資料を読んでいない方はぜひご一読ください．なぜ日本で大規模言語モデルを作れなかったのか，大規模言語モデルがなぜ重要なのかがAIの知見がない方でもわかりやすい資料となっている．

大規模言語モデルの登場によってテキストを扱う一般的なタスクは容易にこなせるようになってきた．では，私たちは今後何を開発するべきなのか．それは，「特定分野特化型AI」である！(と僕は思います．)

ここでいう特定分野特化型AIとは何かというと，例えば法律相談を行うチャットボットや，資産運用のアドバイスを行うチャットボットなど，専門的な知識を持ち，ユーザの状況を把握しつつ的確な助言ができるAI．または，ニュースの要約や，質問応答を行うチャットボットでも，関係するサービスに特化して高精度にタスクをこなせるAIのことである．（最近の例で言うと，GPT-3を使って動画の要約記事を作成するグノシーのサービスのようなものを指す．）
これらの特定の分野に特化したサービスは，chatGPTだけでは実現できない．独自にデータを収集して，独自のAIモデルを作成する必要がある．
ただし，これまでは特定分野に特化したAIの作成は非常に困難だった．その理由は以下の２点である．

複雑なタスクを学習するための評価指標の設計が困難
膨大な学習データを収集することが困難

しかし，昨今の基盤モデルの発展と，chatGPTの成功によって上記の二つを実施するハードルが格段に下がった．これによって，特定分野特化型AIの作成が可能になったと筆者は考える．では，なぜ「評価指標の設計とデータ収集」行いやすくなったのか，どのようにして特定分野特化型AIを実現するのかの２点に関して，記述していく．

評価指標の設計とデータ収集が容易になった理由

これを説明するために，まずchatGPTの学習に使われたReinforcement Learning from Human Feedback (RLHF) に関して簡単に説明する．この手法は，上記に添付したnoteにある松尾先生のスライドが非常にわかりやすいので引用する．

参考: https://note.com/api/v2/attachments/download/a29a2e6b5b35b75baf42a8025d68c175

何を行っているかを端的に説明すると，AIが生成した文章の良し悪しを人間が評価し，その評価が高くなるようなテキストを生成するようにAIモデルを学習しているのである．この学習によって，chatGPTは的確な応答文を生成することが可能になった．

つまり，これまでは定式化できない複雑なタスクをAIに行わせることが困難であったが，chatGPTの成功によって，人間が評価することができるものはAIにも学習させることが可能になったと考えられる．
さらに，これを学習するためのデータは，言語モデルが生成した文章の良し悪しを人間が評価したデータで良いのである．
これによって，評価指標の設計とデータ収集が容易になったと考えている．

どのようにして特定分野特化型AIを実現するのか

どのようにして特定分野特化型AIを実現するのか，ここで登場するのが「ダブルハーベスト」である．ダブルハーベストループは，『ダブルハーベスト勝ち続ける仕組みをつくるAI時代の戦略デザイン』(著: 堀田創, 尾原和啓, ダイヤモンド社) で紹介されているAI事業を成長させる仕組みのことである．これを素早く理解するには，本書の中で紹介されている運転支援システム開発「モービルアイ」の事例を見るのが分かりやすいので，これを紹介する．
（画像は本書の内容を紹介した記事があったので，そちらから引用した．）

「モービルアイ」のダブルハーベストループ１
ダブルハーベストループの第一段階は、データの蓄積によるAIの強化で、持続的な競争優位性を獲得することです。モービルアイの例では、画像解析の精度を高めるために車載カメラのデータを活用する仕組みを作ることで、データを蓄積できるでしょう。データ量の増加により、運転体験の品質が高まります。

「モービルアイ」のダブルハーベストループ２
車載カメラ以外のデータを活用し、さらに強力かつ持続的な競争優位性を獲得します。位置情報などの地理的データや、ブレーキなどのセンサー情報（データ）を収集することでさらにループが回り、精度はどんどん高まっていきます。

この2つのループを作ることで、データを活用した良い事業の仕組みを構築できるでしょう。

https://media.datafluct.com/data-cross-conference-2022-02/

要するに，
1. 蓄積したデータをもとにAIモデルを作成．データをもとにAIモデルを改良することで競争優位性を獲得する．
2. 1.のサービスをもとに得られる別のデータを収集することで，さらにユニークなサービスへと強化することができる．
ということである．

このハーベストルプの考えは，次にように解釈できる．

未完成なAIを市場に投入し，データを収集する．
収集したデータをもとにAIモデルを強化，もしくは独自のAIモデルを作成する．

ここで，ノートの冒頭に示したように，基盤モデルGPT一つで多様な言語タスクをこなせることを紹介した．つまり「未完成ではあるが，使えるAI」はGPTだけで作成することが可能なのである．さらに，いち早く市場に出し，ユーザからのフィードバックを収集することでAIを強化できる．つまり，GPTとRLHFを活用することで，誰でもハーベストループを容易に回すことが可能になった．
さらに以下の図に示したようにGPTモデル 1つでいくつものサービスを立ち上げることが可能である．GPTモデルだけでハーベストループを並列に幾つも回すことが可能である．

今後独自の大規模言語モデルを要する企業が，大きく勢力を拡大していくことが予測される．
(この点で，大規模日本語言語モデルHyperCLOVAを要するLINEは，日本の企業の中で1歩先を行っている．)

ただし，RLHFのためのユーザフィードバックを集め，ハーベストループを回す上で，UI（ユーザーインターフェース）とUX（ユーザー体験）を洗練させることの重要性もさらに増した．どのようにしてストレスなくユーザにフィードバックしてもらうか，どのような形式でフィードバックをしてもらうかをよく考える必要がある．UI・UXの重要性に関しても書籍に書いてあるので，気になった人は是非読んでほしい．

AI時代で勝つには…

ダブルハーベスト勝ち続ける仕組みをつくるAI時代の戦略デザイン』が発売されたのは，2021年の4月だが，この考えは今まさに必要とされる考えである，基盤モデルの発展によって，容易にサービスを立ち上げることができるようになった今，基盤モデルとRLHFを使用していち早くハーベストループを実現することが今の時代に必要とされる．

大規模言語モデルを筆頭に，基盤モデルの開発競争が日本でも激化していくことが予想される一方，いかにして基盤モデルを活用してサービスに落とし込むか，アイデアとスピードが今後のサービス開発では重要になってくる．

とはいえそんなに難しいことを考えずに，やりたいことがAIの力で容易に実現できるようになりつつあるこの世の中を存分に楽しみつつ，このワクワクを共有していきたい．

意見やコメントがある方は是非お願いします！また誤っている部分などあればご指摘ください.

参考文献

https://note.com/akihisa_shiozaki/n/n4c126c27fd3d
https://media.datafluct.com/data-cross-conference-2022-02/
『ダブルハーベスト勝ち続ける仕組みをつくるAI時代の戦略デザイン』(著: 堀田創, 尾原和啓, ダイヤモンド社)

この記事が気に入ったらサポートをしてみませんか？