見出し画像

ディープラーニングG検定の学び

この秋は、㈳日本ディープラーニング協会主催のディープラーニングG(ジェネラリスト)検定の勉強をしていました。
11月9日に受験し、おかげさまで無事合格。先日「JDLA Deep Learning for GENERAL 2019#3」合格証(PDFで!)が届き、ほっと一息です。

JDL2019#3_合格証

今回、この検定は自分にとっては内容的に結構ハードルが高いかなと思いましたが、新聞・雑誌・TVで毎日のように「AI」、「ディープラーニング」の言葉が使われていて、ホントのところ何がどうなっているんだろう思っていたところでした。受験料は高いけど(1万2千円!)、とにかくエイヤーで受けてみようかなと思った次第。

正直言って、やはり最初はかなり取っかかりにくかったのですが、検定の勉強を進めるうちに、自分なりの理解のレベルではありますが、ディープラーニングの奥深さの一端を垣間見ることができたと思いました。また、今回は今までにない驚き、発見があり、結果的には大変面白く、楽しんで勉強できました。

次につなげていくためにも、今回の学びを振り返ってみました。
特に印象的で、これからも考えていきたいことは以下の3つです。

(1)「学び」を学ぶ

(2)抽象度を上げていくことでより本質的なことにたどり着く

(3)「ディープラーニング」を学ぶことは「哲学」「倫理」を学ぶこと


(1)「学び」を学ぶ

 あらためて、「学び」「学習」とは何かを考えるきっかけになりました。「学び」とは、国語辞典では「知識、行動、スキル、価値観を新しく獲得したり、修正すること」とあり、自分では「出来なかったことが出来るようになること」くらいの感じに思っていました。

 しかし、そもそも学習とは何か。どうなれば学習したことになるか。

「『学習』することは『分ける』こと」

とシンプルに、明快に松尾先生は「人工知能は人間を超えるか」の本で語っています(P116)。

「人間にとっての「認識」や「判断」は基本的に「イエス・ノー問題」としてとらえることができる」(P117)。この「イエス・ノー問題」の精度を上げる(=正解率を上げる)ことが、機械学習の本質と言えるとのこと。

人間の認識、判断は必ずしもすべては「イエス・ノー問題」だけではないとは思いますが、人間の思考をシンプルにその問題を判断の中心に置いたとき、見えてくる世界が機械学習・ディープラーニングの世界なのかもしれません。

機械学習・ディープラーニングは人間の「学び」をモデル化して効率的な学習方法を研究する分野であり、機械学習・ディープラーニングの研究を通じて人間を超える判断、分析力を得ていくのかもしれませんが、人間にとっても新たな効果的・効率的な「学び」も再認識できるかもしれないと思いました。

 「ディープラーニング」自体は機械学習の手法の一種で、人間の脳を模したニューラルネットワークを用いたアルゴリズムで課題を解決していく手法。そして、どのような課題を解きたいかによってアプローチは様々。

その「課題」の構造として、3つに大別しています。
①教師あり学習
 与えられたデータ(入力)を元に、そのデータがどんなパターン(出力)になるかを識別・予測する方法
 (例えば、服のサイズの予測、スパムメールの分類等)
②教師なし学習
 入力データにある構造や特徴をつかむ方法。
(例えば、ECサイトの売り上げデータから顧客層の特徴認識等)
③強化学習
 ある環境下で目的とする報酬(スコア)を最大化するためにはどのような行動をとっていけばよいかを学習してくこと。
(例えば、アルファ碁等)

機械学習を進める中で、「課題」を構造化し分類していますが、どのような問題にどのように解決していくのかのアプローチはこの分野だけではなく普遍的なものに感じられ、他にも活用できる気がしました。
 
さて、テキストだけの自学自習でしたので、ディープラーニングG検定の勉強は、予想通り知らない言葉、概念ばかりでした。

これはもう「新たに外国語を学ぶ」という感覚で行こうと思い、用語(単語)の定義を覚え、文法(用語の概念のつながり)を確認する感じで、基本書を何度も読み、問題集を繰り解いていました。

また、本を読むだけではなく、音読したり、書いてみたりと他の感覚も入れての学習も。これは、機械学習の中に、「マルチモーダル学習」(五感や体性感覚といった複数の感覚の情報を組み合わせて処理すること)というアプローチもあり、まさに感覚をいろいろ使った方が、学習が進むのだなあと改めて感じました。

ちなみに、受験対策としては、以下の5冊を読んでいました。
①人工知能は人間を超えるか
②ディープラーニングG検定公式テキスト
③ディープラーニングG検定問題集
④機械学習&ディープラーニングのしくみと技術がわかる教科書
⑤AI白書

画像1

 まず初めに①を入門書として読み、その後は②と③を中心に勉強。③の問題集の解答の解説ページが丁寧に書かれていて分かりやすく、②のテキストの理解が深まりました。

また④はテーマ別にわかりやすく書かれており、②の補完的な本として利用。⑤は分厚いのでパラパラと読む程度。でも今回のテストでは制度政策動向(第4章)や社会実装課題(第5章)あたりの問題が前半多く、結構めげてしまいました。今後「AIと社会」のあたりは、単に試験対策ということだけではなく、社会的にさらに重要な問題になってくる感じがしました。

それから、今はありがたいことに、ネット上で様々な初心者向けの受験対策のサイトがあり、大いに参考にさせて頂きました。

特に参考にさせて頂いたのはこちらののサイト

(2)抽象度を上げていくことでより本質的なことにたどり着く

 画像処理分野で用いられるニューラルネットワークであるCNN(Convolutional Neural Network)の手法は、もとの画像のサイズを「フィルタ」というものを用いて画像から情報量を圧縮し「特徴」を抽出する工程を経てその画像の特徴を把握していく。そして、例えば別の与えられた画像が「イヌ」なのか「ネコ」なのかを見分けられることになるような手法です。

この「特徴量」を抽出する最には、もともとも大きな画像のサイズからフィルタを使って圧縮して小さなサイズにして行きますが、逆にその画像の特徴を良く表すものになっていくことに。

煎じ詰めて煮つめていくことで旨味がギュッとでてくるように、圧縮され抽象化されていくことでその画像の本質がとらえられ、より正解の画像認識が可能となる。

自分は画像のデータ量を増やせば増やすほど(より具体化すればするほど)、その特徴が良く把握できるのではないかと思っていましたが、むしろデータをその特徴を良く表すために少なくしていく(抽象度を高める)工程を実感でき新鮮な驚きでした。

「抽象度を上げていけば行くほど、物事がぼやけていくのではなく逆に本質に迫ることができる」ということが、この歳で今更ですが実感することができ、思わず「おーそういうことだったのか!」と感動してしまいました。

この「特徴量表現」ということをなかなか上手く言葉にできないのですが、松尾先生著の「人口知能は人間を超えるか」のP151に『日本全国の天気から地域をあぶりだす』という章があり、「天気をいかに少ない情報量で伝え、正確に再現することができるか」ということが記載されています。ご興味のある方は是非ご一読を。

また、自然言語処理分野での「word2vec」いう手法では、「単語の意味はその周辺の単語によって決まる」という言語学の主張をベースに、各単語を数学のベクトル空間モデルにあてはめベクトルが指す点同士の距離を計算することで、単語同士の意味関係をうまくとらえることができるという。

この手法はGoogle社が2013年に開発したもので、このような自然言語処理の活用により機械翻訳の精度が上がってきているとものと思われます。

これもまた、ベクトル空間での処理という抽象度の高めることで、言葉の関係性の本質に迫ることができるということを知り。数学の威力を感じました。

やはり、抽象度を高めて本質に迫る手法が数学なのでしょう。
と、、、書いてみたものの、今回のG検定で用語・概念は「認識」(?)できたものの、テスト対策でイメージの理解にとどまり、ちゃんと数学的なバックボーンをもって「理解」できているかと言えば相当(かなり)怪しい。。。(まさに私の「シンボルグラウンディング問題」かも(公式テキストP75))

数学も「初めての外国語」として、学べば良いのかもしれないと、G検定終わってから改めて記号の意味、定義を(単語と文法)を抑えつつ、易しいと言われている本から読み始めています(でも、これでも自分にとっては難しい、、汗)。

画像2

(3)「ディープラーニング」を学ぶことは「哲学」「倫理」を学ぶこと

画像3

この図表は、「AI白書」のP79に掲載されているものです。なんだか哲学の本の序章のページのようです。

AIを開発、実装していくなかで、機械(ロボット)自身が心のような機能が実現可能なのかどうか。また人が認識するということはどのような事なのか。記号(文字)と意味合いはどのようにして結びついて人は理解しているのか等々、AIをめぐって人工知能学者、哲学者等が入り乱れて議論されているようです。

「いま世界の哲学者が考えていること」(岡本裕一郎)にも、一つの章立てにもなっています。またG検定の公式テキストの「人口知能分野の問題」には様々な問題が議論されていて、哲学者の議論も結構紹介されています。

その中で、アメリカの哲学者で「強いAI(汎用型AI)と弱いAI(特化型AI)」という概念を提唱したジョン・サールの「心・脳・科学(Minds, Brains and Science)」を読んでみました。

また1956年に初めてAI(Artificial Intelligence)という言葉が使われた「ダートマス会議」に参加したMIT人工知能研究所創設者のマーヴィン・ミンスキーの「心の社会(The Society of Mind)」を今読んでいる最中です。

画像4

ジョン・サールは人の思考を表面的に模倣するような「弱いAI」は実現可能でも、意識を持ち意味を理解するような「強いAI」は実現不可能と論じている。それは「心的状態というものは生物学的現象である」からと語っている(本書P51)。

また、マーヴィン・ミンスキーは心とは「一つ一つは心を持たない小さなエージェントたちが集まってできた社会」と提示し、「思考を作り出す脳という機械」と表現している(本書P532)。

「機械」という概念をどのように捉え、定義するかで物事の議論が違ってきそうな気がしますが、AIという技術発展によって、様々な分野の専門家が科学技術の観点で「心」とは何かということにアプローチしている。

これはAIと人間、社会とのかかわりというテーマに繋がってくるものでもあり、種々の議論を今後フォローして行きたいと思いました。

例えば、「トロッコ問題」。この問題は哲学、倫理の思考実験の類のものと思っていましたが、自動運転技術の進展により、現実問題としてどのように規定すべきかそうとう悩ましい問題がいろいろ出てきそうです。

さて、せっかくG検定を合格しましたので、もうすこしこの分野勉強したいと思っています。

最近、新聞や雑誌の記事に対しては、「AIを使って」とか「AIを利用して」という表現に対して、「これは何の手法を使っているんだろうか?」と思いつつ、以前よりも興味をもって読むことがちょっとだけできるようになったかなと思います。

また、自分自身、事業会社に身を置く人間として、どのように事業に結び付けられるか、また協業、他社からの提案の際には、どんな手法がより効率的なのか、また目の前にある課題の解決には本当にAIが必要なのかも含めてより実践的なかかわりができるようにして行きたいと思います。

ディープラーニングG検定、面白かったです!


この記事が気に入ったらサポートをしてみませんか?