元大学教員の高校教諭が総務省「情報II」教材を利用した機械学習の授業案を考えてみた｜第8回：AI構築の精度向上にトライする

2022年5月9日 18:40

こんにちは。ヒューマノーム研究所次世代先端教育特命研究員の辻敏之と申します。普段は中学・高校の教員をしながら、ヒューマノーム研究所のお手伝いをさせていただいています。

この連載では総務省から発表された「高等学校における「情報II」のためのデータサイエンス・データ解析入門」を授業で活用するアイデアについて共有します。

無理なくデータ解析全体の流れを学ぶことに主眼を置き、授業内でプログラミングレスな初心者向けノーコードAI構築ツール Humanome CatData とHumanome Eyes を利用することで、生徒がより楽しくデータサイエンスが学べます、という提案です。

これまでの連載は以下のリンクよりお読み下さい。

少し間が空いてしまいましたので、これまでの流れをおさらいします。

テキストの登場人物である高校生の美緒さんが、思い出の写真の仕分けにニューラルネットワークが使えないかな？と着想。僕もそれに沿って、Eyesを使って風景写真を分類するAIを作ってみました。しかし、その結果は今ひとつ。今回はより良い物体検知AI（学習モデル、モデルと呼びます）をつくるため、アノテーションを工夫します。

1. 前回からの変更点

前回作ったモデルがイマイチだった理由について考えましょう。前回は、3カ国（America, Australia, Itary）の画像全体を学習データとして使い、画像全体を学習対象とするようにアノテーションしました。これが良くなかったのではないかと考えました。

そこで今回作成するモデルでは、学習データとして各国の風景と建物にわけて6つのラベル（America, Australia, Itary, AmericanBuilding, AustralianBuilding, ItarianBuilding）を作成し、アノテーションを行うことにしました。アノテーションは第7回で紹介したやり方で行います。

前回と違うところは画像全体を囲うのではなく、物体などモデルに教えたい（学習させたい）部分を囲ってラベルする点です。

図1はイタリア・アマルフィ海岸の写真です。このように各国、風景と建物に分けてアノテーションを施しました。これによってAIは建物について、風景において、とそれぞれ別々に見分けることができるようになるのではないかと期待しました。学習データとして26枚の画像を用い、テストデータとして8枚の画像を使用しました。

右上（赤）と左下（黄）の四角は Itary 、右下（水色）の四角は ItarianBuilding とラベリングしています。青い空と青い海はイタリアのイメージ、アマルフィの坂にたつ建物群はイタリアの建物としてまとめてみました。

これを学習データとして、アノテーション数は64、学習率 0.0004、step数は200という条件で学習を行いました。図2は学習後に表示される予測例の一例です。イタリアの建物がうまく予測されていることが分かります。このモデルを用いて8枚の画像について物体検知を行いました。

2. 改良後の結果

アノテーション方針を変えた学習モデルを作成した結果、2つの画像について自動的にアノテーションを行うことができました。図3は風景を検知した例です。オーストラリアの滝と岩場を正しくオーストラリアの風景だと予測していました。図4はイタリアの町並みを予測した例で、残念ながらオーストラリアの建物だと予測してしまいました。

今回使用したテストデータ8枚の画像では、この2つだけしか予測することができませんでした。しかし、第7回で作成したモデルでは全く予測できなかったことを考えると飛躍的な進歩です。風景を風景、建物を建物だと予測できている点は評価したいですね。

もちろん、このモデルが十分かと言われればそうではありません。データ数が少ないですし、各国の「らしさ」が感じられるものではなかった、つまりクオリティもそれほど高くなかったと感じます。

例えば、図4に示した建物は僕の目から見るとヨーロッパ風に見えます。では今回のモデルがどうしてこれをオーストラリアの建物だと評価してしまったのか。その問いの答えではないかと考えた画像が図5です。

こちらは学習データに含まれるもので、中央の建物は AustralianBuilding とアノテーションされています。この建物と、図4の建物群は似ていますね。このモデルは、人間がイタリアっぽいと感じる建物をイタリアの建物だと評価できず、ちょっと例外的？に思えるたった1つのオーストラリアの建物にその評価を委ねているわけです。

これはやはりデータ数が少ないこと、そしてそのクオリティが低いことが原因です。画像検知において「〜らしい」ことをAIに学習させる場合には、それ相応の数と画像群から雰囲気がわかることが必要です。ちょっとずつ学んで、その雰囲気を獲得していくのがAIだからです。

授業を行う際は、どんな画像を用意すればよりよいモデルが作れるのか、みんなで考えて実際に作ってみるのが良いと思います。ここは各自への、またはグループワークとしての検討課題になるのではないでしょうか。

3. 今回のまとめ

良いモデルを作ることは絶対に重要なことです。このことは揺るぎませんが、未熟なモデルを作ることから学べることも多いと感じました。今回、実際に物体検知AIを2つ作ってみたことで、データを集めることの重要性やその理由を肌で感じることができました。

コーディングすることなく、思いつくままに試すことができる Humanome Eyes は、AIや機械学習を学習する上で本当に優れたツールです。中学生でも気軽に使うことができることはワークショップでも実証されているので、皆さんにもぜひオススメしたいなと感じています。

この総務省教材を利用した教材案についての連載は今回が最終回です。次回からは、今回とは異なる話題をピックアップし、別の確度から「ちょっと楽しいAI解析」のお話をできたら、と考えています。またお読みいただけるとうれしいです！

※ 筆者紹介
辻敏之：機械学習やIoTデバイスを用いた先進的な教育活動に興味があります。好きなことは写真撮影と美味しいものを食べること。普段は中高生に理科を教えたり、研究指導したりしています。

4. データ解析・AI構築の初学者向け自習テキスト

表データを利用したAI学習テキスト（Humanome CatData）

画像・動画を利用したAI学習テキスト（Humanome Eyes）

AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい！

この記事が気に入ったらサポートをしてみませんか？