「名寄せ」って何?具体例と作業のポイント(特許情報分析)
こんにちは! 特許調査の仕事をしてます、酒井と申します。今日は特許情報分析でよく行う「名寄せ」作業について書きます。「名寄せ」を簡単に説明すると「同じ企業(または企業グループ)なのに、何らかの理由で会社名の記載がバラバラになっている状態を、同じ記載に書き直して適切に集計できるようにする作業」です。
簡単な例として、先月ツイートしたものを挙げます。
ツイート内容は 日本製鉄が中国鉄鋼メーカーの宝山鋼鉄と共にトヨタ自動車を「無方向性電磁鋼板に関する特許侵害」に関する特許侵害で訴えた、と報道された時期に
「無方向性電磁鋼板に関する生存中特許は、何件くらいあるのだろう?」と検索してみた、というものです。
「名寄せ」の例:合併と社名変更
検索結果を、単純に(データベースに収録された名義通りに)集計したのが、下記の「名寄せ前」リストです。左側「出願人」欄を見ると「あれ?今は存在しない会社名が多いよね。」と気付かれた方も多いと思います。
鉄鋼業界は2002年に川崎製鉄とNKKが経営統合
2012年に新日鉄と住金が合併していて、他に社名変更などもありました。
上記「名寄せ前」の表の中から、主な関係図を抜粋すると
ざっくりで下記のようになります。
この関係図を踏まえて、黄色い系列は「日本製鉄」に
赤の系列は「JFEスチール」に、それぞれ「名寄せ」をすると
散らばっていた出願人は、日本製鉄とJFEスチールの2社にほぼ集約されます。こうすると「現在の会社名でいうと、どこが権利を持っているのか」がわかりやすくなりますよね。
上記は合併や経営統合、社名変更等を踏まえた「名寄せ」の例でした。
他に「名寄せ」を行う場面の例としては
・グループ企業の出願をひとつにまとめて集計したい
・外国出願人の表記ゆれをまとめたい
といったものがあります。
次にご覧頂くのは「外国出願人の表記ゆれ」の例です。
対象はフランスの光学レンズメーカー「エシロール」社( Essilor International S.A)。遠近両用眼鏡などが有名です。
「エシロール」の日本出願を集計してみると
----
エシロール アンテルナシオナル
エシロール アテルジオナール
エシロール・アンテルナシオナル
エシロール アンテルナショナル
・・・・・
----
といった具合で
「無限にバリエーションがあるのでは?」とすら思えてきます(苦笑)
データベースに収録された出願人名のまま集計すると、
出願実態の把握は難しい、という事がわかると思います。
これは全部「エシロール」で名寄せをすると良いですね。
そうなのですが実は・・・
エシロールの集計・名寄せにはもう一つ、困った問題があるのです。
(お時間のある方は、リストを見てちょっと考えてみてください😄)
「名寄せの困ったちゃん」は1行目。「ニコン・エシロール」です。
「ニコン・エシロールは 名寄せ名義”エシロール”に入れるの?」
「え?ニコンに入れるでしょ?」
「2000年に設立ということだから・・・ニコンとは別じゃないの?」
「ではエシロールに・・・?」
「いや、でも、エシロールに入れる、というのも違和感あるんですけど?」
侃々諤々ものです。
このような時にはどうしたら良いのか?というと・・・
自分たちで『今回はこの基準で集計します』と定義するしかない
のです。
1)ニコンに名寄せ(エシロールには含めない)
2)エシロールに名寄せ(ニコンには含めない)
3)ニコン・エシロールは独立してカウント(エシロールにも、ニコンにも含めない)
のいずれかに決める、という感じです。
これと同じように「定義を決める」話は
グループ企業の出願をひとつにまとめて集計したい
という場合にも頻繁に出てきます
たとえば
「トヨタグループ」について集計したい、という時
・豊田中央研究所は含める?含めない?
・豊田自動織機は含める?含めない?
・豊田合成は?ジェイテクトは?デンソーは?
・・・もちろん、個人個人で感覚は違うと思うのですが
「豊田中研は当然トヨタグループでしょう!」と思った方も、
デンソーが出てくると
「デンソーは、なんとなく別集計しておきたいかも・・・」
と思ったりするかもしれませんよね。
※なお、上記企業名はこちらの「トヨタグループ」から適宜抜粋しました。
そして、先ほどのエシロールの話と全く同じで
1)トヨタのサイトに「トヨタグループ」と書いてあるから、
全部グループで! と決めてもいいし、
2)デンソーとジェイテクトは個別に把握したいから別集計で
・・・と決めてもいいのです。
どちらでもOKですが、集計定義を決めておきましょうね、という事です。
さて・・・
ここまで「外国出願人名の表記ゆれ」「集計定義は自分たちで決める」をお読み頂いて、もしかしたら頭が痛くなりかけている方もいるかもですね。
最後にひとつ、実務のコツをお伝えします。
名寄せ作業は良い感じに手抜きをしよう
ということです。
具体的に行う事は3つ。
1)名寄せ前の状態でとりあえず集計する
2)集計結果を眺める(観察する)
3)集計上位に影響する部分だけ、集中的に名寄せをする(下位は無視)
たとえば冒頭の「無方向性電磁鋼板」の例だとこうです。
「上から・・・新日本製鐵と住金、日本製鉄、新日鐵住金はまとめられる」
「JFEと川鉄、日本鋼管もまとめられる」
「16位以下はまとめても、全体の勢力分布図には影響なさそう」
ということで、こちらの登場人物だけ
名寄せした結果がこちら、になります。
更に、バオシャンと宝山を名寄せしても良いかもですね!
ということで、
名寄せ作業において、集計結果に出てくる全出願人をキッチリ名寄せする必要性は、そんなに高くありません。上位陣を集中的に名寄せをしたら、一般的には十分だと思われます。
(もちろん「下位は寄せちゃだめ」という事はなくて・・・綺麗に名寄せしたデータも個人的には「わ!素晴らしい!(美しい)」とは思うのですが^^)
名寄せだけでなく、集計定義を決めるのも同じです。
ニコン・エシロールと 仏エシロールが 両方トップ20に入っていて、
「両方をエシロールに名寄せしたら、かなり順位が変動するんですけど・・・?」というような時は、「一緒に集計する」か「別個に集計」か、どちらにするかを決めた方が良いです。
でも、どちらも50~100位圏にチラホラ、という状況で
一緒に集計しても大勢に影響なさそうだったら「名寄せせず、そのまま放置」をする、という感じです。(稀にですが、もしも後で「出願件数が少ないけど、エシロール気になる!」となったら、その時点で名寄せをする場合はあります)
「名寄せ」のお話は以上です。お疲れさまでした!
この記事が気に入ったらサポートをしてみませんか?