見出し画像

学校教育関係者のためのAI×教育(3)

(2)では、UNSECOの資料の第1章『はじめに』と第2章の『政策担当者のためのAIエッセンス』のうち、2.1『AIの学際的性質』を紹介しました。今回は、第2章を2.2から、さらに読み進めます。

1.『AI技術についての簡単な説明』

第2章は、『AI技術についての簡単な説明』(AIとはなにか)です。
社会の各業界には、それぞれの専門用語があります。AIに関しても、
研究ーITエンジニア業界の用語がふんだんに出てきます。

教育政策担当者や学校教育関係者が「AIの専門性が深い」ということは、おそらく稀な話で、一から勉強し直しかぁ、という時間も労力も限られることでしょうから、代表的な次の4つの事例をピックアップ(図1)して、ユネスコ資料は紹介しています。

  1. Classical AI(「GOFAI」:「古き良きAI 」)

  2. Machine Learning(略称:ML:「機械学習」)

    • 教師あり

    • 教師なし

    • 強化

  3. Artificial neural networks(ニューラルネットワーク)

  4. Deep learning(ディープラーニング)

Classical AI
初期の「古典的AI」は、「記号的AI」、「ルールベースAI」、「古き良きAI」(「GOFAI」)などと呼ばれ、IF...やTHEN...などの条件論理のルールを連続して記述することが多くあります。といった条件論理のルール、つまりコンピュータがタスクを完了させるためのステップを記述します。

UNESCO資料(2021)

Machine Learning
機械学習(ML)は、ルールではなく、大量のデータを分析してパターンを特定し、モデルを構築して将来の価値を予測するものである。この意味で、アルゴリズムはあらかじめプログラムされているのではなく、「学習」しているのだと言われています

UNESCO資料(2021)

・教師あり学習:
データとラベルを結びつけて、類似のデータに適用できるモデルを構築します。例えば、新しい写真に写っている人物を自動的に識別することができます。
・教師なし学習:
AIにさらに大量のデータが提供されますが、このときデータは分類もラベル付けもされていません。教師なし学習では、データの隠れたパターンや、新しいデータの分類に使用できるクラスターを発見することを目的としています。例えば、何千もの例からパターンを探すことで、手書きの文字や数字を自動的に識別することができます。

UNESCO資料(2021)

・強化学習:
フィードバックに基づいてモデルを継続的に改善する、つまり、学習が継続するという意味での機械学習となります。
AIに初期データを与え、そこからモデルを導き出し、そのモデルが正しいか正しくないかを評価し、それに応じて報酬を与えたり罰したりします
AIはこの強化によってモデルを更新し、再び挑戦することで、時間の経過とともに反復的に発展(学習と進化)していきます。
例えば、自律走行車が衝突を回避した場合、それを可能にしたモデルに報酬が与えられ(強化され)、将来的に衝突を回避する能力が強化されます。

UNESCO資料(2021)

・Artificial neural networks
人工ニューラルネットワーク(ANN)とは、生物の神経回路網(動物の脳)の構造にヒントを得たAI手法の一つです。ANNは、入力層、1つまたは複数の隠れ中間計算層、結果を出力する出力層という3種類の相互接続された人工ニューロン層から構成されます。MLの過程で、強化学習と逆伝播のプロセスでニューロン間の接続に与えられる重み付けが調整され、ANNは新しいデータに対する出力を計算することができます。

UNESCO資料(2021)

・Deep learning
ディープラーニングとは、複数の隠れ中間層から構成されるANNのことである。自然言語処理、音声認識、コンピュータビジョン、画像作成、創薬、ゲノム解析など、近年注目されているAIの応用は、このアプローチによるものである。

UNESCO資料(2021)

さらに、ユネスコ資料では、『2.3 AI技術の簡単な事例紹介』として、上記4つのAI技術を応用したAI技術として、以下の6つを紹介しています。以下の6つの事例は、表2にまとめてあります。

  • Natural language processing (NLP)

  • Speech recognition

  • Image recognition and processing

  • Autonomous agents

  • Data mining for prediction

  • Artificial creativity

2. 生成AIの技術

さて、生成AIは、どのような種類のAIで、どのように『学習』をしていたのでしょうか。
ChatGPTを例にしますと、ChatGPT研究所さんの解説がしっくりときますので、引用させていただくと、

本記事では、ChatGPTを動かしている機械学習モデルをわかりやすく紹介していきます。大規模言語モデルの導入から始まり、GPT-3の学習を可能にした革新的な自己学習メカニズムに触れ、ChatGPTを特別なものにした新しい手法:人間のフィードバックによる強化学習について掘り下げていきます。

ChatGPT研究所

ChatGPTは、マスコミの解説やSNSなどでのAI技術に詳しいエンジニアの方々の解説を読むと、「LLM(大規模言語モデル)」との説明がよくなされます。
しかし「LLMとはなんぞや?」という、AIの技術的な基礎知識の無い多くの
人々にとっては、「まぁ、そういうものか」で終わってしまいがちです。

上記引用のChatGPT研究所さんの文章を見れば一目瞭然で、
「LLMって機械学習(ML)の一部で強化学習なんだってよ!」
ということです。

さて、ここで、ユネスコの資料では、どのように機械学習を説明しているかについては前述の通りですが、生成AIとはなにか?という話も少しだけ触れられています。詳しくはユネスコの資料をご覧ください。

Generative Adversarial Network
最近の多くの進歩、特に画像操作を中心とした進歩は、「Generative Adversarial Network」(GAN)と呼ばれるものによって達成されていることに注目する必要があります。GANでは、2つのディープニューラルネットワークが互いに競合します。1つは「生成的ネットワーク」、もう1つは「識別的ネットワーク」で、可能な出力を作成し、その出力を評価します。
その結果は、次の反復に反映されます。

UNESCO資料(2021)

3.学校教育で考えねばならないこと

生成AIをはじめAIに関して、学校教育関係者のみなさんに知っていただきたいこと・考えていただきたいことが、いくつかあるので、ユネスコの資料と合わせてご覧ください。

3-1 国際理解、倫理、公平性

MLは人間が学習するような意味での学習はしていないことを認識することが重要です。また、独自に学習するわけでもありません。
● データの選択
● クリーニング
ラベリング(ラベル付け)
● AIアルゴリズムの設計
● トレーニング
● アウトプットのキュレーション
● 解釈
● 価値判断
など、MLは完全に人間に依存しています
例えば、ある画期的な物体認識ツールは、画像データベースから猫の写真を識別すると言われていましたが、実際には、似ている物体をグループ化しただけで、その中の1つの物体を猫だと識別するには人間が必要だったのです。
(中略)
シリコンバレーでは、このラベリングを世界中の人々(Amazon Mechanical Turkなどのシステムを利用)やインド、ケニア、フィリピン、ウクライナなどの企業にアウトソーシングしています。

UNESCO(2021)資料

GPT-3、GPT-4、ChatGPTを生み出した企業であるOpenAI のアウトソーシングによるラベリング作業に関しては、イギリスのタイム誌がレポートしています。(Google翻訳やDeePLにて翻訳をどうぞ)

ChatGPTに関しては、現在、無償で利用可能です。なぜ無償なのか。
無償の背後にある労働、倫理や公平性を学ぶことも必要に感じます。

3-2. 生成AIのデータの正確性

ここまでで、生成AIが、機械学習のうち強化学習であり、GANもそうですが、
「AIが学習をし始める時には、人間が作ったデータが必要」
「そのデータは専門家が直接関与する」
「信用できるデータの生成も人間が判断する」
というのが、ChatGPTはじめ、現在の状態のようです。
ユネスコの資料でも、下記のようにしっかり書いてあります。

今日、皆さんが目にするほぼすべてのAI製品は、人間の専門家が直接挿入したコンテンツを必要としている。これは、AIが自然言語処理を使用している場合は言語学者や音声学者から、AIが医療に使用されている場合は医師から、AIが自動運転車を動かす場合は道路交通や運転の専門家から採取した専門知識などかもしれない。
機械学習は、GOFAIコンポーネントの支援なしには、完全なAIを作ることはできない。(Säuberlich and Nikolić, 2018)

UNESCO資料(2021)

加えて、3.1 にあるように、データに関しては「英語圏」の人が低賃金労働で質担保するように努めている訳で、そりゃ、ChatGPTで日本語入力して答させたら(この「英語圏」の人たちで日本語優先できる人は、まずいないでしょうし、日本語は1.2億/70億人が使う、ローカル言語ですので、ニーズの優先度としては後回しなのは言うまでもありません)、日本語でのデータの正確性なんて保証されるわけがありません。
政治家が自分の名前をChatGPTに放り込んで、エゴサーチするようなことをしたら、とんでもない空想上の人物が記述されて返ってきた、だから、AIは大したことないんだよ、的なコメントなりがマスコミが取り上げている事例もあります
これは現在の生成AIの技術的事実の結果ではありますが、日本語や日本に関するデータさえしっかりとしていれば、すぐさま正確な回答が出てくる可能性がある、と言うことを踏まえた発言でなければ、「AIは大したことない」と言う誤謬を国民に植え付ける可能性があることは、公人のみなさんは覚えていただいた方がよろしいかなと感じます。

私事、「ごんぎつね」ガチ勢を自称しておりますので、もちろんChatGPTで「ごんぎつね」に関しても試行錯誤しております。

この事例が正確性の話では、すごく個人的に面白くて、ChatGPTをお使いのみなさんにも試していただきたいのですが、

Q1:日本語で、ごんぎつねの作者を問うと
A1:「宮沢賢治」

Q2:英語で、ごんぎつねの作者を問うと
A2:「Nankichi Niimi(新美南吉)」で、「ごんぎつね」ではなく、雑誌「赤い鳥」に掲載された時点での「ごん狐」で返してくるという。
※新美南吉の原稿では「権狐」、雑誌「赤い鳥」で掲載の際は「ごん狐」、教科書掲載は「ごんぎつね」と、題名が微妙に変わることはご存知のはず。

Q3:そして、英語で質問した後にあらためて日本語で問うと、
A3:新美南吉、は正解。が、宮沢賢治と混同した答えが返ってきて、問うてもいないのに、Powered by ChatGPT 創作「ごんぎつね」のあらすじまで、過剰サービスで述べてくれるという。

さて、学校教育の中で「知識の正確性」は必要か?
と言う問いに対しての回答は" はい or Yes " の一択しかないと思いますが。

4. ChatGPTでの個別指導の可能性

当分の期間は「正確性」を盾にして、ChatGPTでお勉強とかありえない!
と言えるかもしれません。
窓屋のご隠居が「18ヶ月以内にAI家庭教師、爆誕」とか、その元となったであろうと推測されるサルカン氏の「個別学習」の話(Sangminさん、和訳ありがとうございます)とか、は、日本語環境下においては相当に難しいんじゃなかろうか、とも思います。
英語を和訳すればいいのでは?という話でも、教え方って文化の壁が大きいですし、日本の学校教育での教科指導については、学習指導要領とか、教科書指導書とか、指導主事とか、教科部会とか、いろいろとガチガチな制約もありますしね。

AIが指導者役で、児童生徒が学習者であっても、絶対に現在の生成AIにはできないことが一つだけあります。

「AIからの問いがけ、発言(発問・問いがけ)の開始」

そして、前述の引用にもあるように、
"AIは人間の専門家が直接挿入したコンテンツを必要とする"
現状で、そのAIの学習用データの中に、
教える専門家が作ったコンテンツがあるのか」
と言う課題は非常に大きな、越えなければならないハードルがあるように思います。

なぜハードルか?
「教えること」の学習科学的・学術的な知見の正解なんて、人類史上、誰も見つけていませんので。

(次回へ続く)
次回は、もう少しだけ、AI の技術的な話、AIの能力と限界に関する話が続きます。


この記事が気に入ったらサポートをしてみませんか?