見出し画像

家計簿アプリ Zaim における名寄せの検証 - YANS2023ブース展示

くふう AI スタジオ AX 推進部でマネージャーをやっている koya3to です。AX 推進部では、”ユーザーファーストな新しい体験=AX(AI eXperience&AI Transformation)”を推進しています。今回は生成系 AI 周りの研究動向を探るため、NLP 若手の会(YANS)2023 にスポンサーとして参加したのでその内容について報告します。

Zaim における名寄せの検証

くふう AI スタジオはスポンサーブースで2つの展示を行いました。1つは現在AX 推進部で検証中の取り組みについての紹介です。今回はこちらの話題について書きます。

家計簿サービス Zaim では Zaim トレンドというサービスを提供しています。

家計簿データをもとに、外食や流通チェーンの競合・顧客をツール上で分析可能なサービスです。これを実現するためには、家計簿データをチェーンごとに集計する必要があります。

Zaim ではユーザが自由に店舗名を入力することが可能となっていて、同じ店舗を表すにもかかわらず、異なる表記で店舗名が登録されている場合が多々あります。このような状態で店舗、あるいはチェーンごとに集計を行なっても信頼性の低い結果になってしまいます。

このため、ユーザーが入力した店舗を Zaim が持っている店舗マスター(一意に店舗の識別が可能なマスター情報)に紐づけする必要があります。現在はこの紐付けを人手でおこなっているため、多くの時間がかかっています。今回の展示では、この部分の自動化の検証について紹介しました。

検証で利用した手法はシンプルです。はじめに、ユーザ入力の店舗名と店舗マスターに対して、Unicode 正規化やカタカナ化などの前処理を行ないます。次に、正規化した店舗名に対してテキストを1文字ずつずらしながら、3文字区切りのサブワード化を行います。最後に、サブワードの一致度合いをスコア化し、スコアが上位のものを紐付け対象とします。それ以外にも、事前学習済みの言語モデルを組み合わせることで、精度改善を試みたりもしたのですが、定性的な改善が見られなかったため、上記のようなシンプルな手法を採用しました。

検証結果についてですが、完全自動化は現時点では難しく、人手を介する必要があるということがわかりました。ある程度テキスト長があり、ユニークな店舗名の店舗については名寄せ候補上位N=1件に正解が含まれるため、高い精度で名寄せが可能です。一方で、店舗名が短く似たチェーン名が複数あるような店舗については、名寄せ候補上位20件程度を見て初めて正解が含まれる状況で、精度が低いことがわかりました。

実際にブースで展示したポスター

この取り組みをスポンサーブースで紹介したのですが、ブースには研究機関の方だけでなく、スポンサー企業の方も多く訪れてていただきました。スポンサー企業の多くが同じような問題を抱えており、実務の観点から有益なコメントをたくさんいただきました。この点は展示して良かった & 大変ありがたかった点です。今後はこの検証を進めることで、我々の方からも有益な知見を皆さんにも還元できればと思っています。

学会全体について

LLM の登場でとても注目が集まっている研究領域なだけに、学会に参加する皆さんの熱量が非常に高かったように思います。例えば、YANS が主催するハッカソンでは、発表されたばかりの GPT-3.5-turboのfine-tuningを行い、デモを作成されている方がいました。熱量高くキャッチアップされている方々がたくさんいる場で、自分もしっかりキャッチアップしていかねばと背筋が伸びる思いでした。

ポスター展示では LLM をどのように活用するかという話題が多く、企業からの参加者が熱心に発表を聞き、実務にどう生かすかを考えている姿が多かったように思います。それ以外にも、LLM を社会シミュレーションに適用させた発表があり、改めて LLM の適用範囲の広さを感じました。

また、スポンサー企業の多くがスポンサーブースで社内の機械学習事例の紹介を行っていました。中には自分たちが取り組んでいるものと似たようなことを実施されている企業もあり、どの企業も困っていることは同じなのだと感じられた点も良かったです。

人事目線でのイベント参加に関する記事はこちらです。

まとめ

久しぶりの学会参加だったのですが、皆さんの熱量が高く学びが多い学会参加になりました。引き続き研究開発を続け、数年後には自分たちも研究としてポスター発表を行なえるぐらいの組織にしていきたいと思います。

最後に、くふうカンパニーグループでは、「くふう」で暮らしにひらめきを、という企業理念の実現のために、ユーザーファーストの価値観を重視しています。ユーザーファーストを具現化するための主要な手段として、私たちは AI 技術の開発と活用に積極的に取り組んでいます。まだまだできたばかりの組織で、やりたいのにできていないことは多いです。私達と一緒に、ユーザーファーストを体現し、新しい価値を創り出す機会に興味がある方がいましたらご連絡いただけると嬉しく思います!

この記事が気に入ったらサポートをしてみませんか?