見出し画像

GoogleI/O 2024続報2:LearnLMを分析する!ーGoogleサイトで作るグループウェア(113)ー

 🙇🏻いつも、Googleサイトで作るグループウェアを見ていただき、ありがとうございます!


この記事を読んで欲しい方

企業DXや校務DXの進め方に悩んでいる方
クラウドアプリの導入に悩んでいる方
自分だけのGoogleサイトを作ってみたい方

①LearnLMとはなにか

  LearnLMをまとめたものがGoogleから公開されていました。

LearnLMの論文:Towards Responsible Development of Generative AI for Education: An Evaluation-Driven Approach

②Gemini Advanceで要約

 ここからはLearnLMの論文の要約を、教育学的観点からGemini Advance(Gemini1.5pro)で作成したものです。Geminiからの解答は>>>で囲っています。

>>>
論文タイトル: LearnLM_paper.pdf

概要:

本論文は、教育におけるAIの責任ある開発に向けた取り組みを紹介しています。特に、1対1の会話型チュータリングに焦点を当て、包括的な評価プロトコルを提案しています。この評価プロトコルは、会話型AIチュータリングの教育的効果を多角的に評価することを目的としています。

教育学的観点からの要約:

  • 責任あるAI開発への取り組み: 著者らは、教育におけるAIの責任ある開発には、倫理と政策の観点から多様な専門家 (教育学、認知科学、AI、工学、倫理、政策) と最終的な利害関係者 (生徒と教師) を巻き込む参加型かつ学際的なアプローチが必要であると主張しています。

  • LearnLM_Tutorの開発: 著者らは、Gemini 1.0 をベースとした新しいテキストベースのAIチューター「LearnLM_Tutor」を開発し、1対1の会話型チュータリングに特化して微調整しました。

  • 教育的ベンチマークの開発: 著者らは、会話型AIチュータリングの性能を多角的に評価するための包括的なベンチマークスイート (7つのベンチマーク) を開発しました。これらのベンチマークは、定量的な評価と定性的な評価、自動評価と人間評価の両方を組み合わせています。

  • 評価結果: 著者らは、LearnLM_Tutorが教育能力において、プロンプト調整されたGemini 1.0よりも優れていることを示しました。

  • 倫理と安全性の考慮: 著者らは、教育におけるAIの倫理と安全性に関する議論を提出し、教育に特化した介入策を開発しました。

結論:

本論文は、教育におけるAIの責任ある開発に向けた重要な貢献であり、会話型AIチュータリングの開発と評価のための貴重なフレームワークを提供しています。

教育学的観点からの考察:

本論文は、教育におけるAIの責任ある開発の重要性を強調しており、教育学、認知科学、AI、工学、倫理、政策などの分野の専門家による協調的な取り組みが必要であることを示唆しています。また、包括的な評価プロトコルの重要性を強調し、会話型AIチュータリングの教育的効果を多角的に評価するためのフレームワークを提供しています。

本論文は、教育におけるAIの責任ある開発に向けた重要な一歩であり、今後の研究と開発に重要な指針を提供するものと考えられます。

補足:

  • 本論文は、2024年5月14日にGoogle DeepMindによって公開されました。

  • 本論文は、70人の著者によって執筆されました。

>>>

③7つのベンチマークとは

 さらに7つのベンチマークについてGemini Advanceに調べてもらいました。

>>> LearnLM_paper.pdfで提案されている7つのベンチマークは、会話型AIチューターの多角的な評価を目的としています。それぞれのベンチマークは、AIチューターの特定の能力や側面を評価するために設計されています。

  1. 知識と推論 (Knowledge and Reasoning):

    • AIチューターが事実情報と概念を正確に理解し、説明できるかを評価します。

    • 例:歴史的事実の質問、科学的概念の説明、数学の問題の解決など。

  2. 教育的対話 (Pedagogical Dialogue):

    • AIチューターが生徒の学習を効果的に支援できるかを評価します。

    • 例:生徒の理解度に合わせて説明を調整する能力質問を促す能力、フィードバックを提供する能力など。

  3. 生徒のエンゲージメント (Student Engagement):

    • AIチューターが生徒の学習意欲を高めることができるかを評価します。

    • 例:興味深い対話、個人的なつながりの構築、学習目標の設定支援など。

  4. フィードバックと評価 (Feedback and Assessment):

    • AIチューターが生徒の学習進捗を評価し、適切なフィードバックを提供できるかを評価します。

    • 例:小テストの作成、課題の採点、進捗レポートの作成など。

  5. ドメイン固有の知識 (Domain-Specific Knowledge):

    • AIチューターが特定の教科や分野に関する深い知識を持っているかを評価します。

    • 例:数学、科学、歴史、プログラミングなど、特定の分野に特化した質問や課題。

  6. 倫理と安全性 (Ethics and Safety):

    • AIチューターが有害なコンテンツを生成したり、差別的な発言をしたりしないかを評価します。

    • 例:不適切な質問への対応偏見や固定観念の回避個人情報の保護など。

  7. 公平性と包括性 (Fairness and Inclusivity):

    • AIチューターが全ての生徒に対して公平かつ包括的な学習機会を提供できるかを評価します。

    • 例:異なる学習スタイルや能力を持つ生徒への対応、文化的多様性への配慮など。

これらのベンチマークは、AIチューターの開発と評価において、包括的でバランスの取れた視点を提供することを目的としています。各ベンチマークの詳細な評価基準や方法は、論文で詳しく説明されています。

>>>

④おわりに

 LearnLMは、いわゆる一般で提供されている生成AIと比較すると、かなりチューター(指導教員・サポート教員)として特化したAIになっているようです。これがGemini 1.0 proと呼ばれているものです。

 現状では、LearnLMが利用できる場所や範囲が限定されているため、実際に利用して評価するのは困難ですが、いわゆる大学の補助教員レベルとして認識していたほうが良さそうです。
 現在、LearnLMを使ったAIチューターは、大学生以上(18歳以上)でないと利用できない(つまり教師は利用できる。小中高生は利用不可、ただし有料)ようですが、今後、AIチューターがどの年齢レベルまで対応してくるのかが、重要な要素になります。

 まずは、先生が補助教員として使ってみることが重要だと思われますが、はたして日本の学校が、お金を出してまで利用することはあるのでしょうか?
 ここでも、ICT利用の積極性で学校間に大きな差がつきそうです。

ロボット教師



 

この記事が気に入ったらサポートをしてみませんか?