【読書メモ】文系AI人材になる/野口竜司
〈第1章:AI社会で職を失わないために〉
・AI失職は変えられない事実ではあるが、過去同様、AIによって仕事がなくなれば、生まれる仕事もある。
⇒一番ダメなのは今の仕事に執着しすぎて身動きがとれなくなること。
・人間とAIの共働き(共存)をいかにコントロールするかがAI職の役割。
・人とAIの分業は段階によって5つに分類できる。
一型(人だけで仕事)…管理業務、クリエイティブ業務
T型(主は人、AIが補助)…接客、教育、企画・執筆
O型(人の仕事をAIが拡張)⇒高度な専門業務(弁護士、会計士等)、分析
逆T型(主はAI、人が補助)⇒電話応答、運転、運搬
I型(AIだけで仕事)⇒注文・会計業務、監視業務
〈第2章:文系のためのAIキャリア〉
・スクラッチでAIを作る(0から新たに作る)時代から、コードベース(プログラミング)やGUIベース(グラフィカル・ユーザー・インターフェイスの略。ドラッグ&ドロップやクリックによって扱う操作画面)でAIを作る時代に発展し、依然よりもAIを作成しやすい時代になった。
・AIを「作る」ための教材は充実しているものの、AIを「使う」ための教材は不足。
・AIが発展していく中で、ビジネスや業務知識に加え、AIにも精通している人材(文系AI人材)が必要とされてくる(∵既存のAIを利用or新規で作るかの判断力が重要、優れたAIが作成できても正しい業務領域で活用できなければ意味がない)。
・理系AI人材の仕事はAIを作る、現場でAIを動かすためのシステム構築、AIシステムの運用管理の3つ。
⇒文系AI人材の仕事は理系AI人材がやらない仕事以外。
・文系AI人材になるための学びのステップは以下の4ステップ。
①AIの基本を丸暗記する。
②AIの作り方をざっくり理解する。
③AI企画力を磨く。
④AI事例をトコトン知る。
〈第3章:AIの基本は丸暗記で済ます〉
・AIの基本は「⑴AI分類」「⑵AI基礎用語」「⑶AIの仕組み」3つ
⑴AI分類
①AI、機械学習、ディープラーニングの3大分類
・AI=武士、機械学習=徳川家の武将、ディープラーニング=徳川家康(AIの中に機械学習があって、その中にディープラーニングがある。ディープラーニングが特別な存在であったため、機械学習が脚光をあび、AIが急速に発展した)
■AI
・人間と同様の知能を実現させようとする技術
■機械学習
・学習により特定のタスクを実行できるようになるAI。人が学習の特徴を定義。
■ディープラーニング
・人間の脳のニューロンを模した学習法から発展。機械が学習の特徴を定義。
・ディープラーニングより特に広がった分野は、「画像・動画識別力」「自然言語・会話制御力」「物体制御力」。
②学習方式の3分類
■教師あり学習
・あらかじめ答えがわかるデータによって学習させる。
・さらに「分類」「回帰」の2つのタイプが存在。
「分類」…選択肢から適応するものを当てる
「回帰」…数値を当てる
■教師なし学習
・答えがないデータによって学習させる
・機械の自己解釈による集合づくり(「クラスタリング」という)。
■強化学習
・選択を何度も繰り返し、それに対して報酬と罰を与えながら学習させることで、より良い状態を作るための選択を学習させる。
③活用タイプ別のAI8分類
・機能別4タイプ×役割別2タイプ=活用タイプ別AI8分類
・機能別4タイプ
「識別系AI」…見て認識する。
「予測系AI」…考えて予測する。
「会話系AI」…会話する。
「実行系AI」…身体(物体)を動かす。
・役割別2タイプ
「代行型」…人間ができることを代わりにAIが実行。T型、逆T型、I型(AIの分業スタイル)。
「拡張型」…人間ができないことをAIによってできるようになる。O型(AIの分業スタイル)
⑵AI基礎用語
・AIのプロジェクト内でよく出てくる単語は以下のとおり。
■学習と予測
「学習」…AIにデータを与えて法則性を教えること。
「予測」…作ったAIモデルにより未来、未知のものを当てること(推論)。
■教師あり学習と教師なし学習
「教師あり学習」…正解があるお題での学習。「分類」と「回帰」。
「教師なし学習」…正解がないお題での学習。
■目的変数と説明変数
「目的変数」…予測したい値(y)
「説明変数」…予測するための値(x)
■アルゴリズム
「アルゴリズム」…AIが学習する際の手法。学習の手順や方法論のかたまり。
■過学習
「過学習」…既知のデータに過剰な最適化をしてしまい、知らないデータでは全然あたらない状態。これを防ぐためには、学習データの量を増やす、学習させるデータのパターンを多数試し、結果の平均をとるなどの方法がある。
■アノテーション
「アノテーション」…AIに学習させるための答え付きのデータを作成する作業。
■時系列モデル
「時系列モデル」…AIモデルの中でも、時間の流れの概念をもって学習し、未来の予測をするモデル。過去に連続して起きている事象から未来を予測を行う。
■データ前処理
「データ前処理」…データのクリーニング(欠損値や外れ値の対応)や各種データ操作(説明変数のスケール(桁)の調整)を行う。
■PoC
「PoC」…Proof of Concept。本格開発前の事前の実証試験。学習データから期待される精度が達成できるか確認したり、一定精度がでたAIを仮に試用し、満足のいく運用結果が出るかどうか実証したりする。
■ニューラルネットワーク
「ニュートラルネットワーク」…ディープラーニングのベースとなる仕組みで、人間の神経細胞(ニューロン)を模して作られたもの。入力層、隠れ層、出力層に分かれている。入力層でたくさんのデータを受け入れ、そのあと多層になっている隠れ層にデータを渡すが、学習を繰り返すことで、情報が重要であれば太くなり、重要でなければ細くなっていく。この情報の太さや細さのコントロールで多あdしい答えに近づけていく。
■正解率と再現率・適合率
「正解率(accuracy)」…予測系AIの精度を評価するもっともシンプルな指標。全体としての予測と答えの一致率。
「再現率(recall」…答えが正の中で予測が正とされたもの。
「適合率(precision)」…予測を正と判断した中で答えも正のもの。
■AUC
「AUC」…Area Under the Curve。どれくらいバランスよく予測を当てられているかを測る指標。
〈第4章:AIの作り方をザックリ理解する〉
・AIは「データ作成」「学習」「予測」の3ステップで完成する。
・AIは万能ではないといわれる理由の1つは、現代のAIがデータを数値で把握しており、意味合いまで理解しているわけではないからである。
■予測系AIの作り方
「企画」
①AIプランニング
・どんな目的でどのように活用する等の全体の計画
②目的変数/説明変数の定義
・目的変数を精度高く当てるために、関連する筋の良い説明変数をできる限り多く設定する。
・目的に応じて適切な期間が設定されたデータを使用する。
「データ作成」
③学習データ準備
・作るでなく、目的にあったデータ作成を正しく依頼できるかが重要。
④データ前処理
・欠損値や外れ値を見つけ、対応する。
・極端に桁が多い説明変数を置き換えたり等、存在するデータをそのまま使用するでのはなく、項目間の差や変化率等に変換して扱う。
「学習」
⑤AIモデル構築
・分類or回帰の選択⇒変数の選択⇒学習させる回数・時間の設定⇒学習実行⇒精度検証⇒AIモデルのエクスポート
⑥AIモデル精度検証
・正解率が高くても、偏りが大きければ実用度は下がる。
・AUCにおけるTrue Positive Rate(値が正(例えば購入する)と正しく予測できた率)とFalse Positive Rate(値が負(購入しない)と予測したが当らなかった率)のバランスが取れていることが大事。
「予測」
⑦AIモデル実行
⑧運用・再学習
■識別系AIの作り方
・識別系AIは「物体検出」と「画像判定」の大きく2つの機能がある。
「企画」
①AIプランニング
②検出・判定対象の決定
・何をAIに見分けられるようにするのかを具体的に決定する(特定の人物、性別・年代、不良品等)。
「データ用意」
③学習用画像(動画)データの用意
④アノテーション(タグ付け)
・例えば、画像内に車がある場合、場所を囲って「車」と記していく。
・識別系AIの精度に関わる重要なステップで、人手と時間がかかるため、アウトソーシングをすることが多い分野。
「学習」
⑤AIモデル構築
⑥AIモデル精度検証
「予測」
⑦AIモデル実行
⑧運用・再学習
■会話系AIの作り方
・会話系AIの代表格であるチャットボットには「ルールベース型」と「AIによる学習型」の2種類がある。
「ルールベース型」…この質問がきたら、この回答を返すという情報を1つひとつ登録する。質問文と回答文のペアデータがすくない場合は、質問と回答のシナリオを細かく制御できるため、ルールベース型による手動入力の方が適している場合がある。
「AIによる学習型」…質問文と回答文のペアデータをたくさん用意しAIに学習させる。質問文と回答文のペアデータがたくさんある場合は、学習型を採用するほうが良いことが多い(シナリオの入力の手間がないうえ、正しい回答率(正解率)も上がることが多いため)。
「企画」
①AIプランニング
・その時点の会話系AIがどこまでできて、どこからできないのかを正しく把握することが大事。
②人へのエスカレーション設計
・AIの限界を把握したうえで、AIから人へと対応を引き継ぐエスカレーションを正しく設計する。
「データ用意」
③学習データ準備
④質問の似た言い回しと類義語の登録
「学習」
⑤AIモデル構築
⑥AIモデル精度検証
「予測」
⑦AIモデル実行
⑧運用・再学習
■実行系AIn作り方
・実行系AIは予測系AI、識別系AI、会話系AIを組み合わせて作成されることが多い。
「企画」
①AIプランニング
②報酬と罰の設計
・どのうような状況になったら報酬・罰を与えるか、また、それぞれに対してどの状況のときにどの程度の重みをつけるか等の基本ルールを設定する。
「シミュレータ設定」
③シミュレータのセットアップ
・実際の世界で稼働する前に、シミュレータ(パソコン)の中で動作を試験的に行う。
④学習のための設定
「学習」
⑤AIモデル構築
⑥AIモデル精度検証
「予測」
⑦AIモデル実行
⑧運用・再学習
〈第5章:AI企画力を磨く〉
・人間が想像できるAIはいずれ実現されていくことを前提に、アイデアを小振りなものにしないことを念頭において、AI企画に取り組むことが大事。
・AIでできることややるべきことをとにかく数を出したうえで、出したアイデアを「AI導入後の変化量」と「実現性」で評価する(評価の際は「AIを過大評価も過小評価もしない」ことが大事)。
・AI企画においても。5W1Hが重要。
「WHO(誰のためのAI?)」…大きな枠組みとして、顧客・取引先・従業員の3つ。対象を絞ったうえで、さらに具体的に対象をフォーカスする。
「WHY(なぜAIが必要?)」…AIによって「マイナスを減らす」のか「プラスを増やす」のかを考える。「誰のために」と「なぜ、なんのために」を掛け合わせて考えた上で、できるだけ多い変化量を生み出せるAIを企画する。
「WHICH(どのタイプのAI?)」…「識別系AI」「予測系AI」「会話系AI」「実行系AI」の分類と、「代行型」「拡張型」を掛け合わせた8つのAIタイプから適したものを指定する。
「WHAT(どんなAI?)」…①AIの名称②AIができること③AIによって解決されることを書き出す。
「HOW(どう分業する?)」…T型、O型、逆T型、I型のどのパターンか指定する。
「WHEN(いつまでにどう用意する?)」…構築済みのAIサービスを使うのか、自前で作るのかを決める。
〈第6章:AI事例をトコトン知るー業種別×活用タイプ別の45事例〉
・本書参照。
〈第7章:文系AI人材が社会を変える〉
・高速にデータがつながる社会は、AIのための学習データを量産する。
・AIは「消費者、会社、働き手」に対して大きな変化を起こす。
・AI活用のリーディング企業として、Amazon、ソフトバンク、瓜子網(Guazi)社等が挙げられる。
・「ゴールドマン・サックスでは、2000年に600人いたトレーダーが2017年にはわずか2人になった」⇒AIによる金融各社へ起こす変化が大きいものであることを物語るニュース。
・社会変化は発展したAI技術だけでは進まず、新しい技術を使う側の人間によるアイデアと実行力があってはじめて推進される(文系AI人材がAIによる社会変化を引っ張る)。