見出し画像

沖縄とChatGPT、 地理空間と言語処理: NLP2023(言語処理学会 第29回年次大会)レポート

⚠️ この記事は、人間が書きました。

・・・

こんにちは!MIERUNEのソフトウェア・エンジニア、久本(@sorami)です。北海道では雪が溶けてきて、今週、約4ヶ月ぶりに自転車に乗りました。しかし桜が咲くのはまだ先、ゴールデンウィークのころです。

今回はそんな北の大地から、はるか南の沖縄で開催された言語処理学会第29回年次大会(NLP2023)へ参加した模様をお伝えします。


「言語処理学会」の「年次大会」って?

現代において私たちは日々、検索エンジンで調べたり、執筆文章の誤りをソフトウェアから指摘されたり、機械翻訳を介して外国語の文章を読んだり、スマートスピーカーへ話しかけたりしています。これらを実現するためには、コンピューターで人間の言葉を扱う必要があります。そのような技術が「自然言語処理」(Natural Language Processing, NLP)です。いま私が、入力した文字を漢字やカタカナへ変えることができるのも、NLP応用のひとつである仮名漢字変換ソフトウェアのおかげです。

日本におけるNLP研究交流の中心的な場が言語処理学会です。NLPに関連する国内学会としては他にも情報処理学会人工知能学会などがありますが、当学会はその名が示すようにNLPへ特化しているのが特徴で、結果としてコミュニティの密度も高くなっています。

その言語処理学会が年に一度開催するイベントが年次大会です。毎年3月に開催され、全国からNLPに従事する人々が集います。それぞれが自身の研究成果を発表し、活発な議論がなされます。

年次大会は1995年から毎年、日本国内の様々な場所で開催されています:

歴代の開催地 - 筆者作成: https://observablehq.com/@sorami/nenji-stat

第29回目となる今年(2023)の会場は沖縄でした。また、2020、2021、2022はオンライン開催だったため、3年ぶりのオフライン(ハイブリッド)大会となりました。

沖縄開催、3年ぶりのオフライン、そして近年のNLPへの注目もあわさって、今年の年次大会(NLP2023)は、発表件数・参加者数・スポンサー数の全てで歴代1位の規模となりました。以下に示した発表件数の推移を見ると、その突出ぶりがよくわかります(データ出典: 年次大会(NLP) 統計データ):

発表件数の推移 - 筆者作成: https://observablehq.com/@sorami/nenji-stat

ちなみに言語処理学会と年次大会、そして企業との関係については以前、解説記事を書きました。ご興味ある方はそちらもご覧ください:

NLP2023 Okinawa 🌺 🏖️ 🌞

そんな沖縄での年次大会に、北海道から参加してきました。ちなみに前週は道東で流氷を見ていて、そのとき宿泊した北見の最低気温が-16℃、同じときに那覇が+16℃でした。すごい差です。

私は今回、大会プログラム委員、テーマセッション「地理空間情報と自然言語処理」の共同提案者及びセッション座長、そして発表者として参加しました。

会場は宜野湾市の沖縄コンベンションセンター。史上最大の年次大会に相応しい大規模な会場で、沖縄らしく背後にはビーチもあります:

会場概要 - NLP2023公式サイト(https://www.anlp.jp/nlp2023/)より引用
前日に委員で確認した際の展示場 - ポスター発表やスポンサー展示などの開催場所となりました

実行委員会の多大なる熱意により、様々な趣向が凝らされたこれまでにない大会となりました。全7トラックでの膨大な発表が滞りなく行われ、また、初日夜のスポンサーイブニングでは展示場をエイサーが練り歩いたり、日中には参加者による三線の音楽ライブがあったり、休憩スペースでは”ちんすこう”やブルーシールアイスが振る舞われたり、楽しいイベントでした。

会場のキッチンカー - 「かき氷」があって、北海道との違いに驚きました

またハイブリッド開催ということで、委員が会場を練り歩いてライブ配信をしていたり、初の試みとなるオンラインでのポスター発表があったりもしました:

現地会場も、大会Slackも、日夜ずっと盛り上がっている雰囲気を感じました。年次大会は毎回アツいですが、今回はやはり特に熱気のある時間だったのではないでしょうか。その背景には、沖縄開催や3年ぶりのオフラインということに加えて、当分野における近年の大きな潮流もあると思います。それを端的に表したのが「ChatGPT」でしょう。

緊急パネル「ChatGPTで自然言語処理は終わるのか?」

2022年11月にOpenAIが発表したチャットボットサービスChatGPTは、NLPの界隈を超えて、一般でも大きな話題を呼んでいます。公開からたった2ヶ月で、月間アクティブユーザー数が1億を超え、TikTok(9ヶ月)やInstagram(2年半)などとと比べても圧倒的です(関連ニュース)。

そのような状況を受けて言語処理学会理事会は、大会の2週間前に急遽、緊急パネルを開催することに決定しました:

年次大会公式サイト - https://anlp.jp/nlp2023/#special_panel

緊急パネルでは、学術界と企業からのオールスターメンバーが、ChatGPTに代表される大規模言語モデルの出現でNLPがどう変わるのかについて話されました。

緊急パネルの様子

(注: 以下の短い感想は、あくまで筆者が聴講した上でのものです。登壇者らの発言を正しく汲み取れていない可能性があることにも十分ご注意ください)

まず東北大学の鈴木潤先生が、詳細情報が論文などで公開されていない中で、現状の解説をされました。また、定量的な評価がまだ不十分で、そして実社会での応用が先行していることから、皆が戸惑っているのではという指摘には頷きました。

次に、”悪役担当”として京都大学の黒橋禎夫先生が「終わるのか?」という問いに、まず大きく「YES」というスライドを出して盛り上がりました。SNSではこの部分だけを切り取られての共有もありましたが、旧来のNLPタスクが非活発になり、新しいNLPが始まる、という旨趣でした。

続いて東京大学の谷中瞳さんが、先の黒橋先生を受けて、まず若手代表として「終わらないです!」と発言し盛り上げていました。人間らしい言語理解のキーワードとして「構成性」と「体系性」を挙げ、ChatGPTが言語を体系的に理解できていない様子の紹介し、これから言語学・認知科学・哲学などの様々な概念を組み合わせ、協働して調べていく必要があるとの提言をされていました。

LINEの佐藤敏紀さんからは「パラハラ(パラメタ数ハラスメント)をやめよう」など、各種の論点が提供されました。どの点も示唆に富んでいましたが、「これまでNLPがこれほどブームになったことはなかった。これで期待に応えられなかったら冬の時代になってしまう。運任せではなく、大きなブームにする戦略を考えるべき」という提言には視野が広がりました。

AI学習データの作成を行う会社バオバブの相良美織さんは、ビジネスサイドから見た今後起こりうる変化を論じられました。「今回の盛り上がりはUXの勝利かなと思う」という言葉には深く頷くと共に、「だが制約条件を言語化しロジカルに指示できる人は意外に少ないのでは」という話もなるほどと思いました。また「これら入出力データが、研究へ逆向きに揺さぶりをかけ、人間や社会へ寄っていく、そんな動きが見られるとすごく面白い」との意見も非常に良いなと思いました。

相良さんは「今週にもGPT-4がリリースされると言われている。寝て起きたら、どんな世界が始まっているかわからない」ということを仰っていましたが、丁度この緊急パネルの半日後、日本時間深夜に、そのGPT-4がリリースされました。なんというタイミングでしょう。

Twitterではハッシュタグ #ChatGPTで自然言語処理は終わるのか でつぶやかれていました。

今回のパネルは、「NLPの中の人たち」が語る貴重な場だったと思います。ただ、なにぶん緊急企画のため、お昼休みを割いた1時間足らずというとても短い時間で、もっともっと話してほしい…!というところで終わってしまいました。これを踏まえてぜひ来年も、あらためて場を設け、この1年で何が起こったか、これからどうなるか、どうするか、などを論じてほしいなと願います。

また、緊急パネルも踏まえての東北大学の横井祥さんによる別イベントでの資料(2023年3月17日)も、「NLPの中の人」の多くの気持ちを表しているのではないかと思いました:

ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送 - Speaker Deck(横井, 2023)

テーマセッション「地理空間と言語処理」

「言語は面白く,地理も面白い.両方合わさればもっと面白い」

テーマセッション趣旨より

さて、私たちMIERUNEは、位置情報技術に特化した集団なのですが、NLP2023では、我々の分野とNLPの融合領域を模索するテーマセッションを、様々な分野で活躍される多くの方々と共に開催しました:

大会サイト - https://www.anlp.jp/nlp2023/#theme

テーマセッションを主導する奈良先端科学技術大学院大学(NAIST)の大内啓樹さんは、まだ世界的にも研究があまり進んでいない「地理空間」と「言語処理」の融合領域を開拓するべく活動されています。2022年度の科研費Bでは、自身が研究代表者を務めるプロジェクト「文章中の人物の移動軌跡を実世界の地図上に接地するための基礎研究とその応用」が採択されました。

また、MIERUNEは昨年から、NAISTなどと「地理空間と言語処理にまつわる勉強会」を定期的に開催してきました(関連ニュース)。

それらを踏まえて今回は、そのような新たな分野へ取り組む・取り組みたい人々を集める場として、テーマセッションを提案しました。最初は、どれくらいの人が集まるかな… と不安だったのですが、蓋を開けてみると、発表が13件も集まり、本会議最終日の3月16日、1日ぶち抜きで全3セッションを開催することになりました:

大会プログラム - https://www.anlp.jp/proceedings/annual_meeting/2023/ (枠線筆者付与)

13件の発表は、地理空間と言語処理に関わりつつも、それぞれ独自性があり多様で、どれも大変興味深いものでした:

当日は、会場には30名程度の聴講者がおり、加えてオンライン視聴も第1セッションで30前後、第2,3セッションで50前後、最大では60強の接続があったそうです:

テーマセッションが行われた会場

また、大会Slackのテーマセッションチャンネルも常時盛況で、さまざまなコメントや質問が溢れ、投稿数を教えてくれる「#盛り上がり通知bot」チャンネルでも通知回数が圧倒的に多かったです。

我々MIERUNEからは、「住所や施設名といったテキスト」と「緯度経度のような位置情報」を紐付ける処理「ジオコーディング」についての発表を行いました:

そして第3セッションでは、最後に35分程度の「総合討論」を設けました。松田耕史さん(LINE)、小木曽智信さん(国立国語研究所)、新妻巧朗さん(朝日新聞)という異なる分野の3名に登壇していただき、座長ら(NAIST大内さん、NICT東山翔平さん、MIERUNE久本)と議論を行いました。また、現地会場では想像以上に多くの方々がスタンドマイクへ歩み出てコメントや質問をしてくださり、大会Slackでもたくさんの投稿をいただきました。多様な観点での意見が述べられ、視点の広がる時間でした。改めて、参加していただいた皆さん、ありがとうございました。

また、この新たな領域での連携を促進するための Slackワークスペース「Geography & Language」を用意しました。こちらで今後も、議論や、情報の共有、勉強会の開催などをやっていきたいと考えています。年次大会参加者やNLP関係者に限らず、広く多くの方々に参加していただきたい場です。この記事執筆時の2023-03-24時点で、既に丁度100名の方々にご参加いただいております。ぜひ気軽にご参加ください🥳 → Slack参加リンク

Twitterではハッシュタグ #地理空間と言語処理 でつぶやかれています。

今回のテーマセッションやSlackを主導するNAIST大内さんは「論文を書きたいのではない、作りたいのはムーブメント」と仰っていました。言語処理と実世界との接続を目指す領域としてアツいですし、また、地理空間も言語処理も、そもそもとても面白いものです!

文章のなかの地理空間 - 地理空間情報科学(GIS)と自然言語処理(NLP)の融合へ向けて - - Speaker Deck(大内, 2022)

・・・

2024年4月追記: NLP2023でのテーマセッションについては、大内さんが『自然言語処理』に報告記事を書かれています:

・・・

最後に宣伝です😎 「地理空間に興味はあっても、どこから手をつければいいかわからない」という方も多いかもしれません。そんな時には、ちょうど先月(2023年2月)出版されたMIERUNEメンバーによる書籍位置情報エンジニア養成講座』(#位置エン本が、基礎知識と技術が簡潔に述べられており、当分野の導入資料として適していると思います。ご興味あれば、ぜひ手に取ってみてください。書評も書きました↓

おわりに

史上最大の年次大会、大変な盛り上がりで、またこの3年間に会えなかった方々とも久々に対面できた楽しい時間でした。

また、この記事で紹介したほかにも本当に沢山の、興味深く刺激的な発表や交流の場がありました。例えば、東京大学の高道慎之介先生によるチュートリアル「音声合成は次にどこに向かうのか」は、デモも豊富で、初学者にとっても大変分かりやすく全容を解説されており、素晴らしかったです。

私は初めて参加した年次大会がNLP2013だったため、あれから丸10年経ったのかぁ、と感慨深いものがありました。そしてこの10年で、NLPも大きく変わりました。

緊急パネルにあったように、これからもNLPは激動の時を過ごすでしょう。その時に、新たな技術に踊らされず、しかし保守的な態度で無視してしまうのでもなく、地に足をつけて取り組んでいきたいなと思いました。また、テーマセッションで示したような、新たな分野も切り拓かれていくでしょう。その時に、このような専門家たちと議論や交流ができる場は大変貴重であり、日本のNLPコミュニティにとってかけがえのないものだなぁと改めて思いました。

これからの1年で、自然言語処理、そして世界は、どう進展していくでしょうか。どう進展させることができるでしょうか。それではまた来年、神戸NLP2024でお会いしましょう!


この記事が気に入ったらサポートをしてみませんか?