見出し画像

もっと楽しくはじめたい! これからのAI・データサイエンスの学び方

株式会社ヒューマノーム研究所」代表取締役社長の瀬々です。

今回は、AIやデータ解析が広がっていくためには不可欠な「AI入門」のあり方についてお話させていただきます。AIの世界へ、ものづくりの様な楽しさから入門できる環境について考えます。

なお、本稿ではデータサイエンス・データ解析とAIはほぼ同義です。AIをデータサイエンスと読み替えて頂いても構いません。

AI入門は「技術より」でも「経営より」でも難しい

AIの普及とともに、たくさんのAI入門書・入門講座が企画されています。内容は大きくわけて2種類。

1つは開発者・研究者向けで、比較的技術寄り。もう1つはビジネスマン・経営層向けで、AIの歴史や概論、社会的影響に寄せた内容です。

前者に初心者がチャレンジした場合、AI構築にたどりつくまでに、長い道のりが待ち構えます。後者は、AI構築の「雰囲気」だけ学び、実際には手を動かしません。表面だけ理解した状態で開発に関わった結果、現場でAIエンジニアと揉めてしまった、という話をちらほらと聞きます。

下記にAI学習の流れを示します。大きく「理論を知る」「プログラミング」「モデル構築」「モデル利用」「課題設定」の5段階があります。

スクリーンショット 2021-04-08 10.37.21

エンジニア向けのAI入門教材は、基礎を重視する場合は理論から、より実践的な場合は、理論を軽くしてプログラミングからはじめるものが多いようです。

とはいえ、前回お話したとおり、プログラミングは人により得手不得手があります。新しくできたAI・DX関連部署へ異動した方が、実技重視の講座を受けた場合、AI構築までがあまりに遠く、心が折れる可能性は否定できません。

逆に、ビジネスマン向けの教材では、現代AIの歴史や思想、導入の注意点を中心に、AIによってビジネスが変革する過程を学べます。AIを作る場合は、この後、先述の技術者向け教材に取り組むこととなります。

技術者向け教材は多くの場合、なんらかのプログラミング経験者向けの内容です。とはいえ、ほとんどの方はプログラミングも機械学習の数式も知りません。当然「何からはじめたらいいの?」という質問が続出します。

どうしてAI学習に行き詰まってしまうのだろう

画像3

確かに、AI構築を完全に理解するには高いハードルがあります。プログラミングスキル、データサイエンスの知識、結果の評価方法など、様々な知見が求められるためです。これらが絡まり合い、AIの学習が目的化してしまったように感じます。

そもそも、AI・DXはデータを活用した新しい世界を作り出すための手段のひとつです。

それなのに、データを見て、触って、楽しむ、というAI構築が本来もつ楽しさへ到達する前に学習に行き詰まってしまう。これがデータサイエンティストの育成が難しいと言われる原因ではないか?と懸念していました。そして、お客様と会話する中で、その懸念は確信に変わりました。

初心者向けAI教材に欠けているもの

例えばギターをひこう!と思い立ったら、次に何をするでしょうか。ギターを木から切り出して作る、和音などの音楽理論を学ぶ、というところからはおそらくスタートしないでしょう。

適当に弦をさわったら音が出た!というワクワクからスタートし、もっと素敵な演奏や、かっこいい曲づくりに向けて音楽理論を学ぶ、と進むのではないでしょうか。AI構築も同じです。モデルの構築やデータ解析には、楽器を演奏したり、作曲するような楽しさがあります。

私は、AIにはこの楽しさを伝える入門講座と、例えばiPhoneに標準搭載されている楽曲制作アプリ「Garageband」のような、気軽に使えてプロユースもできるような入門ツールが欠けているのでは?と考えました。

画像5

AI開発って何が楽しいの?

AIの開発には、ゲームのように予測精度を高める技術的な楽しさと、AIで変わる世界を想像する楽しさがあります。

一例としてKaggleというサイトをご紹介します。企業や政府が出した問題を解決する、より高精度の解析モデルを作るべく、世界中の機械学習・データサイエンスに関わる人が集まり、競います。

Kaggle同様、AI構築には、計算式・プログラムを組み上げるだけではなく、作ったAIを実際のデータで試し、精度を確認する行程があります。この「データを集めてモデルを構築して、また試す」という繰り返しこそがAI独特の楽しさです。

AIは、その本質ゆえに生まれる楽しさと難しさを併せ持ちます

理論を学び、プログラムができてもAI開発は終わりません。データを集め、集めたデータに情報タグをつけ(アノテーション)、データと作成目的に合わせたモデルを選び、機械学習アルゴリズムを設定する(パラメータチューニング・ハイパーパラメータチューニング)、といった作業が続きます。

スクリーンショット 2021-04-08 17.59.52
スクリーンショット 2021-04-08 18.00.08

データ収集以降のステップは、これまでのITプロジェクト開発には存在しません。この方法は馴染みが薄い上、AI開発が抱える「不確実性」が影響し、一般的なソフトウェア開発で使われる「課題を分割して解決する」開発方法(ウォーターフォール型)がうまく合いません。

この点が、経営者的な視点からAI構築に関わった方が困惑する点です。人数を増やしてもプロジェクトは進まず、時間を伸ばしても必ず良い結果となるとは限らないのです。

この「不確実性」がAIの開発手法の抱える本質です。

しかし、データ解析側としては、ここがもっとも楽しい試行錯誤の時間だったりします。あーでもない、こーでもない、などと話しながら、より良いモデル、より良い解釈を目指して磨き続けます。芸術作品を作っていくようなイメージです。

スクリーンショット 2021-04-08 12.50.56

高校生がAIづくりの楽しさを証明してくれた

一番ワクワクするモデル作成からはじめたら、AI構築やデータ解析の楽しさや難しさを知った上で、プログラミングやビジネス構築に流れる、というAI入門システムを作れるのでは?

そんな風に考えた当社は、わかりやすく、応用範囲の広い画像・動画と、表データ(エクセルデータ)を対象に、モデルを作るところからはじまる初心者向けツールの開発をはじめました。

Eyesは「画像」、CatDataは「表データ」用のツールです。無料で試せますので、ぜひ遊んでみて下さい!


Humanome Eyesは、トライアルを高校生にお願いしました。彼らは1時間ほどのチュートリアルで操作をマスターし、その3ヶ月後行われた高校生向け学会で発表された Eyesを活用した生物学研究の成果は入賞を果たしました。

AIとは縁遠かった高校生がAIを使い、私達の考える「これからのAI教育と研究スタイル」を体現してくれました。非常にうれしかったです。

AIがもたらす新しいパラダイム

一般にAIは、計算工学・計算機科学の一分野とみなされます。しかしながら、AIを活用することを考えた場合、計算工学的な視点だけではなく、データ収集・活用の問題や、完成後に待ち構えるビジネスの問題など、単なる手段にはとどまらない面まで視野を広げる必要があります。

今のAIには、研究面でもビジネス面でも計算技術・応用・データを総合的に判断し、さまざまな分野を横断する新しいパラダイム(この時代で規範となる物の見方や捉え方)が求められていると感じます。

次の記事では、「実際に作ってみた」から始まるデータ解析の流れを解説しながら、新しいAI入門の形をご紹介します。


次の記事はこちら


AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい。


この記事が気に入ったらサポートをしてみませんか?