見出し画像

第1章 6.検索式の基本・再現率と適合率(前編)

 特許調査を行う際に、調査範囲を画定する検索式の作成における重要な指標として、再現率と適合率(精度)がある (※1,※2) 。

 「再現率」とは、どれだけ網羅的な検索ができたかを表す指標であり、情報全体から調査目的に適合する情報を拾い出すことができた割合のことである。
 「適合率(精度)」とは、どれだけノイズが少ない検索ができたかを表す指標であり、拾い出した情報中に調査目的に適合する情報が存在する割合のことである。

 図1.6に示す検索式①の場合、再現率は60%(存在する5つの適合文献☆から3つの☆を抽出)、適合率(精度)は30%(ヒットした10文献中に適合文献が3つ含まれている)となる。

画像1

図1.6 再現率と適合率(精度)

 ここで、検索範囲を広げて、再現率を向上させて網羅的な検索を行う場合、検索集合にノイズが増加するため適合率(精度)が低下してしまう(後述の図1.9の上図、検索式③)。逆に、適合率を向上させて検索集合の絞り込みを行うと、検索漏れの可能性が上がり再現率が低下してしまう可能性がある。図1.7の検索式②では、再現率を下げずに、適合率を向上させることに成功しているが、更に絞り込みを行うと、検索漏れが生じてしまう可能性が高いことは容易に理解できる。

画像2

図1.7 適合率を上げる

 つまり、再現率と適合率にはトレードオフの関係があり、調査の目的に応じて検索式を作成する必要がある(※3) 。
 図1.8に示すように、侵害予防調査では、侵害の可能性がある権利を1つでも見逃してはいけないため、広く漏れがない網羅的である点を重視して再現率を向上させることが基本となる。

画像3

図1.8 再現率と適合率の関係

 また、出願前調査や無効資料調査では、適切な情報のみを抽出する点を基本的には重視して適合率を向上させると良い。但し、調査毎に再現率と適合率のどちらを重視するかは、その背景や事情に大きく依存するため、再現率及び/又は適合率のどちらを重視するかは一義的に決まるものではなく、コストを考慮して、柔軟にバランスを取ることになる。

↓つづき


※1:野崎篤志、「研究開発&特許出願活動に役立つ 特許情報調査と検索テクニック入門」、一般社団法人 発明推進協会(2015年1月)、96-98頁


※2:小島浩嗣、「技術者・研究者のための 特許検索データベース活用術」、秀和システム(2017年2月)、141-147頁

※3:桐山勉、「特許調査の実践と技術50-特許調査における桐山流発想法-」、情報科学技術協会(2011年10月)、32-33頁、「14 推定再現率と適合率の図で何を考えるか」


この記事が気に入ったらサポートをしてみませんか?