見出し画像

元大学教員の高校教諭が総務省「情報II」教材を利用した機械学習の授業案を考えてみた|第1回:総務省教材解説

こんにちは。ヒューマノーム研究所 次世代先端教育特命研究員の辻敏之と申します。普段は中学・高校の教員をしながら、ヒューマノーム研究所のお手伝いをさせていただいています。大学教員時代は遺伝子の配列やタンパク質の構造などの大規模データを計算機を用いて解析するバイオインフォマティクスと呼ばれる分野で研究を行っていました。

ヒューマノーム研究所では、手軽にAIを構築することのできるHumanome Eyes(以下 Eyes)やHumanome CatData(以下 CatData)を用いてより先進的な教育をどうやって展開していくか、AIや機械学習とは一体なんなのかについてよりわかりやすく伝えることができるかといったテーマで、授業案の作成や授業実施を担当しています。

さて、先日、総務省から「高等学校における「情報II」のためのデータサイエンス・データ解析入門」と題した補助教材が発表されました。

情報IIは2022年から開始される新学習指導要領で、必修科目としての情報Iを発展させた選択科目として導入されます。

現在の「情報」ではデータを表にするなどの処理、簡単な統計量(平均や分散など)、グラフの作成などにとどまっていましたが、情報Iでもより踏み込んだ実践的な内容になる予定です。新学習指導要領でも情報Iについては

問題の発見・解決に向けて、事象を情報とその結び付きの視点から捉え、情報技術を適切かつ効果的に活用する力を育む科目

【情報編】高等学校学習指導要領(平成30年告示)解説

だとしており、情報IIの狙いは

具体的な問題の発見・解決 を行う学習活動を通して,問題の発見・解決に向けて 情報と情報技術を活用するための知識と技能を身に付 けるようにし,適切かつ効果的,創造的に活用する力を養い,情報社会に主体的に参画し,その発展に寄与 するための資質・能力を養うことである

高等学校情報科「情報Ⅱ」教員研修用教材(本編)

としています。なんだか盛りだくさんで本当に大丈夫なのかと不安にもなりますね。

そして、より具体的な教員用研修教材が文部科学省から公開されました。その補助教材と銘打って総務省が公開したものが冒頭で紹介したテキストになります。このテキストの内容は実に骨太です。以下に構成を示します。

第1章 データサイエンス(機械学習のアルゴリズム)によるデータ解析が社会にもたらす変化
第2章 機械学習を用いたデータサイエンスのプロセス
第3章 機械学習(教師あり学習)
 線形回帰
 サポートベクターマシン
 決定木・ランダムフォレスト
 ニューラルネットワーク
 ナイーブベイズ法
 K近傍法
第4章 機械学習(教師なし学習)
 クラスター分析
 主成分分析
 因子分析
 アソシエーション分析
第5章 構造化データ処理の基本
 並べ替え
 抽出
 型変換
 重複・欠損・異常値の処理
第6章 非構造化データ処理の基本
 言語処理の基本
 画像処理の基本
第7章 プログラミングの基本
 RとPython

高等学校における「情報II」のためのデータサイエンス・データ解析入門

第1章ではデータサイエンスとはなにかというところから、機械学習、深層学習、AI、ビッグデータ、IoT、ロボティクス、量子コンピュータなどの言葉の整理、データとはなにかという根本的な話題について詳しく解説されています。

第2章ではデータの取得、前処理、可視化、モデリング、評価、実例がまとめられています。このように大きな流れを平易に示したテキストはあまりなく、指導するという観点からみても、例が多く示され授業の資料を作りやすい構成になっています。

第3, 4章では本格的な解析が始まります。美緒さんという妙にセンスの良い高校生が教師あり学習と教師なし学習を使いこなして高校生活を謳歌していくという筋立てで進行していきます。美緒さんは python を用いて解析をしています。ここで用いたデータとともにコードもJupyter notebook形式(*.ipynb)で配布されており、端末さえあればGoogle Colabolatryを用いてすぐに実行できてしまいます。

第5, 6章ではデータの取扱について、簡単にまとめられています。特に5章では型変換や欠損値の処理などプログラミングを行うことが前提となった知識について述べられています。6章ではより高次な情報である言語、画像についてPythonなどでどのように処理するか簡単に述べられています。

そして、最後の第7章ではプログラミングの基本的なことについて述べられています。

とても良いテキストなことに疑いはありませんが、テキスト内で示されているサンプルコードはひと目見て意味がわかるほど簡単ではなく、あまり初学者向けではありません。

当然情報IIを選択する生徒たちがターゲットであることからもこのコードを示す意図はわかります。ただちょっとだけ、Pythonのコードを解説しながら機械学習の便利さ、特に2章、5章で示されたデータの取扱いから学習にいたるまでの流れを、生徒にうまく伝えるのは難易度が高いのではないかと感じました。

そこで本稿では、当社が提供するノーコードAI構築ツール Humanome CatDataとHumanome Eyes(以下 Eyes)を用いて、「第3章 機械学習(教師あり)」に沿った授業案を紹介させていただきます。両ツールとも無料利用できます。

CatDataを使うことで、第2章・第5章で考えたデータの前処理、可視化、学習、評価といった一連の流れを体験すること、第3章で取り扱われているサポートベクターマシン(SVM)、ランダムフォレスト、ニューラルネットワークを用いたカテゴリデータの予測を行うAIを構築することができます。

また、Eyesを使うことで、第6章で扱った画像データを学習データとし、第3章で考えたニューラルネットワークを用いて、物体検知AIを構築することができます。

いずれもコードを書く必要はありません。授業内でデータ取得からAI構築、そして評価までの流れを理解するという観点では大変優れた仕組みだと考えています。

次回からは、実際のデータを使い、総務省テキストに沿ったノーコードツールを利用した授業案についてご紹介します。ぜひお読み下さい。

※ 筆者紹介
辻敏之:機械学習やIoTデバイスを用いた先進的な教育活動に興味があります。好きなことは写真撮影と美味しいものを食べること。普段は中高生に理科を教えたり、研究指導したりしています。


データ解析・AI構築の初学者向け自習テキスト

表データを利用したAI学習テキスト(Humanome CatData

画像・動画を利用したAI学習テキスト(Humanome Eyes)


AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい!

この記事が気に入ったらサポートをしてみませんか?