見出し画像

HCI×CALL (HCI分野におけるコンピュータ支援言語学習)

はじめに

本記事はHuman-Computer Interaction (HCI) Advent Calender 2022 19日目の記事です。今回の担当、東京大学博士課程の河村和紀と申します。普段は機械学習による技能判定/技能獲得支援AI-Guided Learning」の研究をしています。今回の記事では、自身の研究に関わるトピックの一つでもある、コンピュータ支援言語学習について、HCI文脈でどのような研究がなされているのか簡単に記したいと思います。

CALLとは?

コンピュータ支援言語学習(Computer-Assisted Language Learning, CALL)とは、学習者がより効果的に言語を習得できるよう、コンピュータやソフトウェアなどのテクノロジーを活用する枠組みを指します。1960年代に開発されたCAI(Computer-Assisted Instruction)の流れをくみ、当時はプログラム学習やドリル形式の練習が中心でしたが、パーソナルコンピュータの普及やインターネットの登場によってオンライン経由で多彩な学習活動が可能になり、教育現場や個人学習の場で急速に広まっていきました。

近年はモバイルデバイスの性能向上や機械学習技術の進歩により、学習者の行動や理解度を解析して最適な教材やフィードバックを提供するパーソナライズ学習が注目されています。場所や時間を問わず学習を続けやすい点や、興味・目的に合わせて柔軟にコンテンツを選べる点などがCALLの大きな利点です。たとえばDuolingoやMemriseのようにゲーム感覚で単語や文法を身につけられるシステムや、音声認識を通じて発音を評価・矯正するツールなど、多様なアプローチが提案されています。

応用先は単語や文法の基礎学習にとどまらず、発音練習や会話シミュレーション、異文化理解のためのマルチメディア教材などにまで広がりを見せています。たとえばリアルタイムのビデオ会議システムを活用すれば、遠隔地の講師と対話を重ねながら学習を進めることも容易になり、学習ログを記録して分析することで、学習者それぞれに合った指導法を提示できるようになりました。

このように、CALLは歴史的にはプログラム学習から始まったものの、インターネットやモバイル技術の進化とともに形を変え、現在では機械学習を使った誤答解析や自動フィードバック、学習継続を促すゲームデザインの要素などを取り入れながら発展を続けています。教育学や言語学だけでなく、心理学やコンピュータサイエンスの知見を融合させた学際的な研究分野として注目されており、次のセクションでは、CALLにおけるユーザとコンピュータのやり取りに焦点を当てたHCI(Human-Computer Interaction)の研究事例を中心に紹介していきます。

HCI分野でのCALL

HCI (human-computer interaction) 分野での CALL 研究は、コンピュータを使った言語学習におけるユーザとコンピュータとのやり取りに焦点を当て、言語学習をより効果的かつユーザフレンドリーにするための研究が多いです。

例えば、ユーザのモチベーションを保つために、ユーザが個人的に関心があるWebコンテンツや動画を用いて言語学習ができるようにする研究があります。一例を挙げると、As We May Study [Lungu+, CHI '18] は、外国語を学習している学習者が個人的に興味を持つ資料をインターネットで読み、過去の読書をもとにしたインタラクティブな学習を行うことで、単語を習得することを可能にするように設計されています。このシステムは、デスクトップやモバイルデバイスでの読解サポート、個人的に興味を持つ資料を探すための文書検索、個人的に興味を持つ資料を読んで得た単語を使ったインタラクティブでパーソナライズされた演習を統合しています。著者らは、学習者が個人的に興味を持つ資料を読むことで学習効率が向上し、モチベーションも向上することを示す実験結果を示しています。

As We May Study では、学習者が読書中に単語やフレーズを理解できないと感じた場合、
その単語やフレーズを選択して、その意味を確認できます。

このような研究の他の例としては、 ALOE [Trusty+, CHI '11]、Foreign manga reader [Kovacs+, UIST '13 Demo]、ViVo [Zhu+, CHI '17] などがあります。

他にも、第二言語を日常生活の中で自然に取得することを可能にする研究があります。例えば、Vocabulary Wallpaper [Dearman+, CHI '12] は、モバイルデバイスを使って、第二言語を自然に取得する手法について研究している論文です。この論文では、スマートフォンの画面の背景に壁紙のように常に単語を表示するアプリケーションを提案しています。また、学習者に与える単語の種類が文脈に関係するか否か(ユーザの居場所に即したものかそうでないか)が、学習者の単語取得率にどのように影響するかも調べ、文脈に関係する単語を与えられた場合に、そうでない場合と比べて、学習者の単語取得率がより高くなることが分かっています。

Vocabulary Wallpaper では、壁紙のように背景に単語が表示されます。
単語は動的に変わり、実行中のアプリケーションに遮られない限り常に表示されます。

このような研究は、他にも MicroMandarin [Edge+, CHI '11]、WordSense [Vazquez+, CHI EA '17]、 Wait-Learning [Cai+, CHI '20]、VocabEncounter [Arakawa+, CHI '22] などがあります。

さらに、既存の言語学習手法をより効果的に学習できるように支援する研究もあります。WithYou [Zhang+, CHI '20] は、言語学習者が外国語のテンプレートスピーチを聞いてそれに同期しようとするシャドーイングのトレーニング方法を改善するための音声認識システムです。WithYouは、言語学習者がシャドーイングに失敗すると、自動的にテンプレートスピーチの再生や難易度を調整することで、シャドーイングをスムーズにすることができます。

WithYou はテンプレートスピーチに一時停止を挿入することで、
シャドーイング中に学習者がより正確に同期できるようにします。

このような研究の他の例としては、Cyrafour [Encinas+, CHI EA '15]、CAST [Reza+, CHI '21] などがあります。

これまでに説明してきた3タイプの研究以外にも、Apraxia World [Hair+, CHI EA '20]、Delivery Ghost [Cho+, CHI EA '21] のように言語学習ゲームが言語学習に与える影響を調査するものから、TransPhoner [Savva+, CHI '14]、Sketchforme [Huang+, UIST '19] のように新たな言語学習を生み出すツールや、AwkChecker [Park+, UIST '08] や PTeacher [Bu+, CHI '21] のように学習効果の高い学習者の間違いをフィードバックする方法を提案するものまで様々な研究があります。

DDSupport

最後に宣伝ですが、つい先日ICMLA2022にて、DDSupportという言語学習支援システムを提案したので、簡単に紹介させてください。

DDSupport を用いた発音学習のプロセス

CALLの中でも、発音の学習を支援するシステムは 、CAPT (computer-aided pronunciation training) と呼ばれ、広く研究がおこなわれています。機械学習技術を応用したCAPTの代表的な手法は、対象の言語のネイティブスピーカーなどのお手本となる発話者と学習者の発話を比較し差異を計算し、ユーザにフィードバックするというものです。

ここで、このようなシステムの課題として、比較対象のお手本となる発話者/発話を学習できるセンテンスが限られるというものが挙げられます。要は、お手本と学習者の発話を比較する必要があるので、比較対象がそのお手本1人に限られるということと、お手本と比較するために予めこれから学習するセンテンスをお手本が発話しているデータを集めておく必要があるということです。

そこで、学習者が自由なセンテンスを発話学習可能にしたのがDDSupportです。また、特定の1人の発話者と比較することなく、ユーザの発話が対象言語をどの程度うまく話せているのかということや発話がうまくいっていない場所を可視化します。

DDSupport のシステム概要図

もしより詳しく知りたい場合は、論文や関連記事を参考にしてください。また、コメントや感想もお待ちしています。論文では、感覚的に発話を修正できる機能についても紹介しています。


いいなと思ったら応援しよう!