見出し画像

「言語処理学会」の「年次大会」とはなにか: Legalscape は NLP2022 をスポンサーしています

これはLegalscape アドベントカレンダー 2021🎄のエントリです。 前回は「Legalscape の現在のシステム構成とこれまでの歩み」(小宮)でした。

・・・

こんにちは!Legalscape ソフトウェア・エンジニアの久本(@sorami)です。

我々は「法のインフラ」を目指している会社です。事業の詳細は、アドベントカレンダーの1日目、CEO八木田による記事をぜひご覧ください!↓

さて、弊社は自然言語処理の分野において国内最大の学術イベント「言語処理学会年次大会」に、今年(2021)に続いて来年(2022)もゴールドスポンサーとして協賛しています。

この記事では、そもそも言語処理学会の年次大会とはなにか、そして我々はなぜ企業として学会をスポンサーしているかについて、簡単に解説します。NLP業界に興味を持っている方や、企業と学術界の関わりについて関心のある方にとって、なにか参考になれば嬉しいです。

「言語処理学会」の「年次大会」ってなに?

私たちは今では当たり前のように、検索エンジンでなんでも調べたり、機械翻訳を使って文章を読んだり、スマートスピーカーへ話しかけたりしています。これらを実現するためには、コンピューターで人間の言葉自然言語扱う処理必要があります。そのような技術が「自然言語処理」(NLP, Natural Language Processing)です。いま私が、入力した文字を漢字やカタカナへ変えることができるのも、NLP応用のひとつである仮名漢字変換ソフトウェアのおかげです。

さて、日本におけるNLP研究交流の中心的な場が言語処理学会です。NLPに関連する国内学会としては他にも情報処理学会人工知能学会などがありますが、当学会はその名が示すようにNLPへ専念しているのが特徴で、結果としてコミュニティの密度も高くなっています。

その言語処理学会が年に一度開催するイベントが年次大会です。毎年3月に開催され、全国からNLPに従事する人々が集います。それぞれが自身の研究成果を発表し、活発な議論がなされます。

言語処理学会第24回年次大会(2018, 岡山)メイン会場の様子

この年次大会、近年は右肩上がりに規模が拡大しています。2011年豊橋は600名弱だった参加者数が、2019年名古屋には1,000人を超え、最新の2021年北九州では1,508人にまでなりました(ただし2020年と2021年は原則オンライン開催で、それまでと状況が少々異なります。ちなみに2022年は、現地浜松とオンラインのハイブリッド開催を目指して準備が進められています)。

馴染みのない方が「学会」と聞くと、格式張ったものを想像されるかもしれません。しかしこのイベントは、研究発表に加えて、コミュニティにとっての「同窓会」的な役割も兼ね備えています。日本のNLP研究業界はそれほど巨大ではなく、大体の人が知り合いか、知り合いの知り合い、みたいな世界です。会場をうろついていたら知り合いに出くわして、近況を報告しあったり、最近気になっている研究トピックについて盛り上がったり、夜には皆で飲みに行ったり。むしろそちらのほうがメインだと思っている参加者も多いのではないでしょうか。

言語処理学会第24回年次大会(2018, 岡山)バンケットの様子

私は2013年(名古屋)が初めての参加でした。当時研究していた、まだマイナーだった分散表現というトピックについて、関連する発表をいくつか見つけ、声をかけて食事へ行ったことを覚えています。同じことに関心を抱いている同士なわけで、初対面でも盛り上がります。ちなみに名古屋では他にも、ひつまぶしを食べたり、当地出身者に連れられ台湾ラーメンを食べに行ったり、日本酒を愛でる会へ参加したり、申し込みを忘れてバンケット(晩餐会)に参加できなかった恩師とあんかけスパゲッティを食べに行ったりしました。食べてばっかりですね。それで食べたり飲んだりしながら、研究のアツい話とか、研究以外のアツい話とかを延々とするのです…

・・・

また大会では、特定の題材を取り上げて議論するテーマセッションやワークショップも併せて開催されます。2022年大会では私も「日本語における評価用データセットの構築と利用性の向上」というワークショップに運営として関わっております。発表や聴講参加、お待ちしております!

なぜLegalscapeは年次大会をスポンサーするのか

この年次大会には毎年、沢山の企業がスポンサーとして協賛しています。最新の2021年はオンライン開催にもかかわらず、弊社を含め59もの企業・団体がスポンサーになっていました(歴代2位の数)。そこにはNLPに馴染みのない方々でも知っているであろう大きな会社も多く含まれています。

スポンサーになることで、ウェブサイトにロゴが掲載されたり、会期中にスポンサーブースの出展ができたりします。また2018年岡山からは、初日の夜に「スポンサーイブニング」という各企業による自社宣伝LT大会が開催されています(そしてオフライン開催であれば、関心を持ってくれた人たちを連れて各企業は夜の街へと消えていきます…🍺)。

2021-12-06 22:30 追記: 2018年の大会委員長だった山本和英先生からコメントをいただきました!↓

(追記ここまで)

さて、Legalscapeは、2021年から続いて2022年もゴールドスポンサーとして協賛しています。参加したり論文発表するだけならその必要はないのですが、なぜ、まだ小さな会社である我々も、わざわざスポンサー協賛しているのでしょうか?これには大きく「企業広報」と「コミュニティ貢献」という二つの動機があります。

・・・

まず広報について。上で述べたように、日本のNLP業界はそれほど大きくはありません。そのため年次大会は、関係者へリーチする最良の場となります。そして、NLPへ本格的に取り組んでいる会社は世の中にそう沢山あるわけではありません。NLPをやりたい専門家たちにとって、このニッチな場へ出展する企業は、目に留まりやすいでしょう。ウェブサイトくらいはチラ見してくれるかもしれません。私や私の知り合いも、転職を考えるときは大体、年次大会のスポンサー欄を眺めます(ただ近年はNLPが世の中でも流行ってきていますし、スポンサー数も増えているため、昔ほどは「オッ」と感じる度合いは下がっていると思います)。またもちろん人材獲得だけではなく、サービス導入や他社との協業などへ繋がる可能性もあります。

Legalscapeは、法律情報を扱う会社です。そして当領域にあるほとんどのデータは自然言語で記されたテキストであり、NLPと親和性が高いものです。そのため、このような場へ出て、少しでも名前や取り組みを知ってもらいたいなと思っています。

・・・

また、スポンサーにはそれだけでなくコミュニティのサポートという大切な側面があります。

私たちが業務で利用する様々なNLP技術は、それに取り組んできた先人たちがあってこそ存在するものです。それは論文として発表されたり、はたまたソフトウェアやデータとして公開されたりと、様々な形で広く世の中へ共有されてきました。よく言われる「巨人の肩の上に立つ」という比喩の通り、どこかひとつの企業やひとりの研究者によってゼロから生み出されるものなどなく、皆、過去や同時代のコミュニティから恩恵を受けています。その上でそれぞれ、その先の可能性を日夜模索し、生まれた知見がまたコミュニティへ還元されていく。そのようなコミュニティを育む言語処理学会や年次大会は尊いものだと私は思います。自由闊達に研究が議論され、新たな縁が生まれる場。スポンサー協賛を通じて、その持続可能性を少しでも助けられるのではないかと考えています。

もちろん、論文という形で知見を共有したり、ソフトウェアやデータの公開という形での貢献などもやりたいところなのですが、Legalscapeはまだ10名足らずの小さな組織で、なかなか手が回らないことが多いです。それでもまずはスポンサーという形で、コミュニティへ少しでも貢献できれば嬉しいですね。

ちなみに2022年大会はスポンサー協賛だけでなく、民事判決のオープンデータ化に関わる実証実験についての論文発表も行う予定です!

(そして同様の観点からLegalscapeは、ユニコード・コンソーシアムをスポンサーしたりもしています。詳細は以下の記事に↓)

おわりに

この記事では、言語処理学会とその年次大会、そしてそれを弊社がそれをスポンサーしている背景について解説しました。NLP業界に興味を持っている方や、企業と学術界の関わりについて関心のある方にとって、なにか参考になったのであれば嬉しいです。

それでは、2022年3月の言語処理学会第28回年次大会(NLP2022)でお会いできることを楽しみにしております!🙌

・・・

そんなLegalscapeでは積極採用中です。カジュアル面談だけでもいかがでしょうか?ぜひ気軽にご連絡ください。

・・・

Legalscape アドベントカレンダー 2021🎄、明日は「Legalscape のリモートワークを支えるコラボレーションのしくみ」(秋元)です!

(カバー画像: 歌川広重『東海道五十三次・濵松』