松尾豊先生講演内容 前編[2019年4月5日第3回AI・人工知能EXPOセミナー]
-------------------------------------------------------------------------
4月5日 [金] 13:00~14:30 <ディープラーニング最新動向>
「ディープラーニング」の最前線と今後の展望
東京大学 大学院 工学系研究科 教授 松尾 豊 先生
-------------------------------------------------------------------------
※本内容は、上記講演会の内容を筆者が解釈し要約したものとなります。
また要約内容は講演の内容をそのまま転記したわけではなく、より理解しやすいように追記した部分や、追加した例題的な事例を含みます。
筆者の理解が追い付かず、誤解を招く表現や間違っている箇所がある可能性がございます。そのような点を発見された場合は、コメントにてご指摘いたらければ幸いです。
**********************************************************************
ディープラーニングの最前線と今後の展望
2019.4/5 松尾豊氏講演内容の要約
深層学習の自然言語処理は、等比級数的な進化を遂げている
1.深層学習 自然言語処理における2018年の2大トピック
2018年の2大トピックとして、新たな二つの手法による自然言語処理が注目された。
一つ目は「ELMO」
この手法により、「雨」と「飴」や同じ文字列だが意味が異なる言葉を翻訳する際、文脈から判断して適切な意味を選択することが出来るようになった。
二つ目は「BERT」
この手法では、自然言語処理タスクを教師データなしで、かつ双方向に事前学習することが出来るようになった。これにより、WEB上にある莫大な量のテキストデータが利用可能になった。
この二つのトピックが意味する事は、自然言語処理能力の飛躍的な進歩だ。
自動翻訳や、音声入力の自動文字おこしにおいて、時折発生していた聞き間違いのような事象が、前後の文脈から判断し補完することが可能になる。
2.深層学習 画像認識処理におけるトピック
・画像認識に加え、空間認識が飛躍的に進化
・「GQN」の開発
Alphabet傘下のAI企業DeepMindは視認できる情報から目で見えない部分を推測する「Generative Query Network(GQN)」を開発
人間は目をつむって「海」と思えば、「海」を想像できる。このように景色を想像できるのは、人間には三次元的な空間認識能力が備わっているからである。
ある視点から見たら、どのように見えるのか、をこれまでのAIには出来ていなかった。それが可能になった。
従来から三次元をモデリングする手法は存在したが、それは、空間の三次元構造を点群やメッシュなどを用いて陽に分解して把握していた。
GQNは複数の視点の画像だけから、対象の三次元世界を符号化し異なる視点からの視界を復元する。空間モデルを潜在変数とする潜在モデルで最適化する。Structure from MotionをNNで直接解いたものであり、この1~2年内の最大の進歩
3.ディープラーニングの今後
まずディープラーニングとは何か
ディープラーニングを簡潔に言うと、深い関数を使った「最小二乗法」となります。その特徴は、変数の数が「多い」ことと「深い」ことです。
※「深い」という事が重要です。
「ディープラーニング」は、「汎用目的技術」です。
ディープラーニングは、インターネットやコンピュータ、トランジスタやエンジン、電気といった、上記に匹敵する数十年に一度の技術。
汎用的に利用することで世界を変える技術です。
前回の汎用目的技術は、インターネットでした。
インターネットをうまく活用できた企業(ガーファ等)が世界の中心になっています。
そして、今回はディープラーニングです
現在のディープラーニングは、20年前のインターネットです。
あなたは1999年に戻ったらどういう行動をとりますか?
世の中はまだインターネットの可能性を信じていません。
爆発的な発展を遂げる前のインターネット前夜に、あなたが出来る事は無数にあります。
ディープラーニングは今が爆発的な発展を遂げる前夜です。
あなたのできる事は無数にあります。
インターネットは、
① 検索、EC 2000年代
② ソーシャルのフェーズ 2010年代
③ シェアリングのフェーズ 2018,19,20~
このように進化してきた。
AI/ディープラーニングは、
① 画像認識のフェーズ 2013年
② 機械・ロボットのフェーズ 2023年
③ ???のフェーズ 2033年
AIは、今後10年で1300兆円のGDPの伸びをもたらす
すでにGAFAなどで、大きな活用がされている。
4.ディープラーニング・AIをビジネスに利用するには
①パイロットプロジェクトを実行し、勢いをつける。
簡単なもので良いので、小さな成功をする事が重要だ。
それを6ヶ月から1年でやることです。
会社の中でAIに慣れ、さらにAIプロジェクトに投資すること繋がれば、
それだけで意義がある。
②インハウスにAIチームを作る
外部パートナーは初期の勢いをつけるのに重要だが、
長期的にはインハウスのAIチームでプロジェクトを進める事が効率的だ。
③AIのトレーニングを提供する
CourseraなどのMOOCsを利用すれば、
経済的に多くの従業員を教育することが出来る
既存のコンテンツをうまくキュレートする事
エグゼクティブは最低4時間以上のトレーニング
部門リーダーは12時間以上のトレーニング
AIエンジニアは100時間以上のトレーニングをうけてください
④AI戦略を作る
AIは企業に付加価値をもたらし、また他社の参入障壁を作り出すことが出来る初期のAIプロジェクトが成功し、深い理解が得られてくればAIがどこに付加価値を作り出せるか、どこにリソースを張るべきか考えられる。
①から③が終わった後に、④をやらないと意味がない。
●データは鍵となるアセットである、そのために重要な要素は以下の通り
戦略的なデータ取得
AIシステムは少ない場合は100、多い場合は一億程度のサンプルデータで構築される。
多くのデータを持っている事は悪いことではないので、
AIチームはデータを得るために何年 もかけた戦略を実行する。
統合的なデータウェアハウスが必要です。
50個の異なるデータベースが50人の管理者の元にあったら、
それは50の分散したデータにすぎず、利用することは出来ません。
⑤内部・外部のコミュニケーションを作る
IR 投資家に説明
GR 産業や社会にAIの重要性を説明
顧客教育 顧客に大きな利益をもたらすことを説明
人材獲得 強い企業のブランドがAI人材をひきつける
内部コミュニケーション
上記の①~⑤は米国での手法だが、日本ではこの手法が難しいとされる点がある。
【日本における差異】
ⅰ. 年功序列が強すぎて大企業であればあるほど企業のトップの理解度レベルが低い。上記①から⑤の手法を提唱した、Andrew先生が考えているレベルよりも、日本はずっと低い。
ⅱ.IT/機械学習にたいする社会全体の理解レベルのベースが低い。
ⅲ.人材育成がずっと遅れている。MOOCSが英語なので、英語圏での情報に比べて、日本語圏の情報は2,3年遅れている。大学等での人材育成も時代に追いついていない。