見出し画像

学会報告|AFFECTIVE COMPUTING & INTELLIGENT INTERACTION (ACII 2022)

この記事を書いたのは 山岡さん.


10/17(月)~10/21(金)に第10回 AFFECTIVE COMPUTING & INTELLIGENT INTERACTIONが奈良県の「奈良春日野国際フォーラム甍」開催され、Empathからは山岡が参加させていただきました。

AFFECTIVE COMPUTING & INTELLIGENT INTERACTIONはACIIと呼ばれる国際学会で2005年に第一回目が開催されました。

ACIIでは名前の通り、人の感情を解析してロボットがパートナーの感情を理解したり,感情を持った振る舞いができるようになることを目指す,Affective Computingという研究領域と、知的なインタラクション(人間から何らかの作用を受けたシステムや機器が、その作用に応じた動作を返すこと)
の開発に向けた発表が中心の国際学会です。

ハイブリッド開催

今年のACIIは対面とオンライン(Zoom)でのハイブリッド開催となりました。会場では、世界各国から発表者が集い50名以上の方が常に会場にいらっしゃいました。
具体的な人数はわからないですが、オンラインでも50人以上が参加しているSessionもありました。

今回のACIIは、口頭発表で50個の論文の発表があり、発表の形式として、Long Talk Session(発表数:20個)とFlash Talk Session(発表数:30個)の二つがありました。

Long Talk Sessionは、16分の発表+4分間の質疑応答の時間をワンセットとし、発表者の数繰り返すSessionでした。
Flash Talk Sessionは、質疑応答を行う前に発表者が全員一人5分で発表を行い、全員の発表が終わった後に12分の合同質疑応答の時間を持つSessionでした。

研究動向

感情を検出する研究をはじめ、感情を検出した後に同様にその結果を活用できるかの検討をしている研究の発表が中心でした。

感情の検出では、音声を用いた研究[1]と表情を用いた研究[2]に大別されてセッションが設けられていました。
検出だけではなく、SERモデルの構築に用いられた感情データの会話とモノローグ発話に焦点をあてた分析を行った研究[3]や感情ではなく笑顔を検出する研究などの発表[4]もありました。

また、メンタルヘルスの分野の研究も盛んに発表されており、ストレスの検出[5]の発表がありました。

学会中に特に議論が盛んにおこなわれた議題は

  • どのようにしてデータを集めたのか

  • どのようにしてどのように評価を付けたのか(感情やストレスの有無)

  • 言語や文化が異なった場合の再現性について

などがありました。
アノテーションの方法は一意に定められるわけではなく、研究の目的や環境に依存してしまうことがまだ多々あり、非常に難しい問題の一つです。

アノテーションの問題は弊社でも注意深く毎回考えている問題の一つで、今は自社で独自のアノテーションツールも開発してそれを利用してデータを生成しています。
アノテーション問題については様々はバックグランドを持った素敵な人々と活発に議論を交わしたい問の一つです。

おわりに

今回の学会ではbanquetも開催され、国内外の研究者との有意義な交流の場にもなりました。(ただ日本人は少なかった…)
このような機会を作ってくださった運営の皆様、発表者の皆様のご尽力に感謝いたします。
今後も継続的に発表や参加をして、素敵な時間を共に過ごせたらと思います。

2023年AFFECTIVE COMPUTING & INTELLIGENT INTERACTION(Cambridge, Massachusetts (USA)開催予定)も楽しみです。
最後までお読みいただきありがとうございました。


参考文献
[1] Sina Alisamir, Fabien Ringeval and François Portet
Multi-corpus Affect Recognition with Emotion Embeddings and Self-Supervised Representations of Speech.

[2] Shuvendu Roy and Ali Etemad
Analysis of Semi-Supervised Methods for Facial Expression Recognition.

[3] Woan-Shiuan Chien, Shreya G. Upadhyay, Wei-Cheng Lin, Ya-Tse Wu
, Bo-Hao Su,Carlos Busso, Chi-Chun Lee
Monologue versus Conversation: Differences in Emotion Perception and Acoustic Expressivity

[4] Hugo Bohy, Kevin El Haddad and Thierry Dutoit
A New Perspective on Smiling and Laughter Detection: Intensity Levels Matter

[5] Mehrab Bin Morshed, Javier Hernandez, Daniel McDuff, Jina Suh, Esther Howe, Kael Rowan, Marah Abdin, Gonzalo Ramos, Tracy Tran and Mary Czerwinski
Advancing the Understanding and Measurement of Workplace Stress in Remote Information Workers from Passive Sensors and Behavioral Data.

この記事が参加している募集

学問への愛を語ろう

この記事が気に入ったらサポートをしてみませんか?