名寄せとは?重要性について詳しく解説します
「名寄せ」という言葉をご存知でしょうか?
同一の存在だが表記が分かれているものの表記を統一することを指します。例えば、以下は別々の表記ですが当然同じ場所を指しています。
私たちは例のような情報を見た時に同一性を認識できます。
しかし、機械はこれらを表記が違うため別々の情報として認識してしまうため、統一の表記に修正=「名寄せ」をする必要があります。
今回は「名寄せ」がなぜ重要なのかを事例と併せてご紹介したいと思います。
名寄せの事例
①顧客情報
マーケティングや営業活動に用いられる顧客リストが代表例となります。
個人情報保護法による顧客情報の一元管理の必要性や、マーケティング活動の効率化と顧客満足度の向上を目的に名寄せの重要性が高まっていることもあり、これまで別のデータベースで管理していた顧客情報を一括で管理し、全社で共有するようになっている企業が増えています。
ここでデータベースが整備されておらず同一で管理すべきデータが分散していると以下のようなことが発生してしまう可能性があります。
このような状態を放置すると、営業コストの増加や顧客からの不信感につながってしまうため、複数のデータベースに分かれて顧客情報を管理している場合は共通のDBで一元管理することが望ましいと言えます。
②住所情報
物流や行政サービスにとって住所の不揃いが課題になっています。
日本では役所や用途ごとに様々な台帳で住所が管理されており、これらの土台となるルールがそれぞれ異なることが課題の背景にあります。
特に国や自治体では手続き書類の住所情報の修正に膨大なコストがかかっており、試算では年間約240億円分にも上ると試算されています。
バラバラな住所情報がそろう経済効果は明らかになっており、英国は統一した住所のデータ基盤「ベース・レジストリ」の構築に2015~2020年の間で70億円の投資をし、282億円のコストを削れたと推計されています。
日本でもデジタル庁によって「ベース・レジストリ」の構築が進められており、整備された暁には新しいビジネスチャンスも生まれてくることが予想されます。
参考記事:DX阻む「ふぞろいの住所たち」 データ統一は難事業
③属性情報
「名寄せ」は対象が同一かどうかだけでなく、その属性の表現方法にも適用されます。
例えば、商品のサイズにおいて「幅」「横幅」だったり、「営業部」と「販売部」だったりは、同一の情報なのであればそれらの属性で情報を抽出できるようにするために名寄せしておくことが望ましいでしょう。
上記のような整備作業を日頃から行っておかないと、いざデータを検索して利用する際に思わぬ手間がかかってしまうことがあります。
まとめ
名寄せの重要性を事例と簡単に紹介しました。名寄せを行い複数の情報を繋げる、重複を排除することがデータ活用には必要になります。
Massteryは名寄せを基本機能として備えつつ、より実用的な活用方法も提案しております。以下の仕様(スペック)情報の自動抽出、カテゴリ予測では機械学習を用いた名寄せを行っています。
主要な機能のご紹介は、よろしければこちらの記事をご覧ください。