見出し画像

特許公報をたくさん読む時の工夫

こんにちは! 特許調査業をしてます、酒井というものです。
ちょうど1ヶ月ほど前から、
◆アメリカの特許公報(英語)をたくさん(数千件)読んで
◆不要な公報(ノイズ)は除去
◆調査テーマに関連しそうな公報には フラグ立て
という作業(以下「査読作業」)をしていました。

そこでこの記事では「調査会社では、公報をたくさん読むときこんな工夫をしてます」という内容を書いていきます。

昨日夕方の時点で、長かった査読作業にも終わりが見えたので
嬉しくなって朝から・・・

とツイートしたところ、
私には予想外の反応を色々頂きました。

画像1

とか

画像2

・・・などですね。

とはいえ
弁理士・弁護士の先生方は「公報を読む」というと、権利範囲の判断をされる機会が多いんじゃないかなー? と想像してます。それだと米国特許450件読むのは、さすがに無理そうな気がします・・・😅

でも、私のは「ノイズ判定も含めて」なので、そこまで大変じゃないです。
もちろん機械翻訳もありがたく使ってます

ちなみに「ノイズ判定」というのはどんな感じか?もご紹介しますね。
作業用に、Excelで特許リストを作ってあって・・・(下記)

画像3

評価欄が「空欄」になっているものが「ノイズ」です。
評価ポイントが3つあり「技術分野が一致していない」とか「特定の要素を記載している」などのポイントに沿って公報を判読していきます。

そして、評価ポイントと合致しているものは
コメント欄に請求項番号や、段落番号などを添えてコメント。評価も入力していきます。(この表だとA、Cが評価です。)

ノイズ判定分についても「なぜ、ノイズ判定したか」がわかりやすいように、一言~20文字程度で、簡単にメモを記載します。

・・・というようなイメージで、判読結果の記録をとっていきます😀

それで、今日は「調査会社では、公報をたくさん読むときこんな工夫をしてます」という話なのですが。自分の場合、大きく分けて4つポイントがあります。キーワードは「段取りの勝利」「リズム感」です。(←自分で言ってるし・・・😜)


1.公報はブラウザで読んでます。(2021年春時点)

画像4

キャリアの長い方は、わりと「たくさん読む時は紙公報だよね!ね?酒井さんもそう思うよね?」と同意を求められる場面が、時々あるのですが・・・最近は曖昧に「そうですねぇ~」ってかわしてます。すみません。

それで、外国公報をたくさん読む時は  100% ブラウザ上で読んでます。
日本公報は商用データベースの場合もあるけど、最近はやっぱりブラウザで開くことが多くなりました。

ブラウザ側で使うのはGoogle PatentsかEspacenet。
どちらを使うか?は、調査テーマと対象国で変えています。
ちなみに今回は「(電気、機械、素材・・・って感じでいうなら)ソフトウェア」で「全部米国特許」だったので、Google Patentsを使いました。

つまり・・・

1)商用データベースで検索
2)商用データベースでCSV出力
3)調査テーマに合わせて 公報番号に固有のURLを生成
4)公報査読は ブラウザ上で行う

という手順です。

え?「なぜ、商用データベース持ってるのに、Google Patentsで?」って?
それは「試行錯誤してみたら、それが最速だったから」ですよー😀

なぜ、ブラウザだと速くなるのかは 3.で説明しますね。

2.リストは事前にソートしておく

画像5

ソート項目は調査テーマによって若干変えているので、
ぜひ、工夫してみて頂きたいのですが、
今回の一連の査読で使っていたソート条件は

1)特許権者/出願人(マージデータ)昇順
2)発明の名称(先頭20文字切り出しデータ)昇順
3)出願日 降順

です。日本語で説明するならば「会社順で、かつ、技術的に近いものが一箇所に固まるように並べる。類似技術があれば新しい順に」と考えました。
こうしておくと、無関係(ノイズ)も、抽出すべき公報も、ある程度固まって出現するので、作業にメリハリをつけることができ、要注意公報も見逃しにくくなるメリットがある、と思ってます。

で、ソート条件の 1)2)は、ちょっと説明が必要かもしれないです。

2.1 特許権者/出願人(マージデータ)昇順

これは「出願人順でソートするため」の項目です。
米国特許、特に米国企業による出願は「出願人名=発明者名」になっているケースが多いので「特許権者データがあれば特許権者名、なければ発明者名」という列を 関数(IF文)で作って、並べ替えデータにしています。

2.2 発明の名称(先頭20文字切り出しデータ)昇順

出力した母集団を観察してみると「同一出願人による、ほぼ同じコンセプト、同じカテゴリーの出願は、同じような発明の名称になっている・・・」と思ったのです。でも、名称の後半が違っていたりするとうまくソートできない。ということで、名称の先頭から20文字を LEFT 関数で切り出しました。

なお、今回はソフトウェア分野だったためか、分類での並べ替えが有効に機能しなくて、半ば苦肉の策で「名称の先頭20文字」を使った、という事情があります。分類が有効に働く場合は、普通に分類データを使ってもいいのかも・・・。ただ、分類って複数付与されている場合が多いので、リストを並べ替える目的なら「カンマ区切り」などを利用して筆頭分類を取り出すと良いと思います。

繰り返しになってしまいますが、「会社順で、かつ、技術的に近いものが一箇所に固まるように」並べておくと、査読作業にメリハリをつけることができるし、要注意公報も見逃しにくくなるメリットがあって、個人的にはかなりおすすめです✨

3.プラグイン達が大活躍

画像6

上記1.2.で
   ・Google Patents(またはEspacenet)の固有リンクが入っており
   ・読みやすくなるよう、ソート(並べ替え)を実行した
Excelファイルが準備できました。

次は公報をブラウザで読む番です。作業環境は次の通り。

OS  Windows 10
ブラウザ Chrome
プラグイン Pasty / Multi-highlight

上のほうで

え?「なぜ、商用データベース持ってるのに、Google Patentsで?」って?
それは「試行錯誤してみたら、それが最速だったから」ですよー😀

と書きました。実際の作業中は・・・

0)Chromeを立ち上げる。Multi-highlightと「英語を常に日本語に翻訳」を両方ONにしておく。

画像8


1)Excelの固有リンクを25行分、あるいは50行分「がばっ」とコピー。(CTRL+Cでクリップボードにコピー)

画像9

2)ブラウザのPastyボタンで貼り付けると、行数分のタブが「ぶわっ」と一挙に開きます。(Gifにしてみました!)

画像10

3)実はこのままだと「現在表示中のページ」しか読み込まれません。
1公報読むごとに次のタブに移動し、都度読み込ませてもいいのですが
私「せっかちさん」なんです。もしくは効率厨。(あ。知ってました?)

そこで、
Chromeのキーボードショートカット
CTRL+PageUp、または CTRL+PageDown (機能は「隣のタブに移動」)を1~2秒間隔でひたすら押して、全タブを強制的に読み込ませます。

なんか・・・1件コメント書いて、次の公報に移ったとき、
読み込みで待たされると、公報読みのリズムが保てなくなっちゃう感じです。強制読み込みで開いてあると、リズムが崩れなくてよいのです。

あと、公報読みのとき。
マウスでスクロールすると行き過ぎたりする事もあるので、
キーボードから PageDown (こっちはCTRL不要です)で、
きっちり1画面ずつ行送りするのが好きです。

4)Multi-highlight というプラグインは、文字通り「複数のキーワードにハイライトをつけるプラグイン」です。こちらに抽出の目印になる単語をたくさん入れておきます。

日本語に機械翻訳したGoogle Patentsだったら、
ハイライトする単語も「日本語」で大丈夫!
決して回し者ではありませんが、かなり便利でオススメです★

3.1  Google翻訳(非英語→日本語)の小ワザ (2021/07/27追記)

非英語公報→日本語 に翻訳する場合のメモを追記しました。
Google Patents や Espacenet は「英語のページ」と認識されるらしく、
中国語、ドイツ語などの公報だと、機械翻訳されなかったりします。
・・・という場合の対処法です。下記リンクからどうぞ。

4.50件ごと、区切って作業してます

画像7

公報読みって、調子が出てくると無限に読めちゃったりするし
調子が出ないときは、10件でも飽きますよね・・・

画像11

私、調子がよい時でも、50件読んだら
  ・ちょっと立ち上がるとか
  ・コーヒー入れてくるとか
  ・観葉植物が乾いてないかなー?って見るとか
  ・仕事場の音楽変えるとか
ちょっとした「何か」を挟むようにしてます。

ついでに(こっちがメインなのかもしれないけど)

画像12

50件ごとに、作業時間の記録もつけてます。
なんか、ドン引きされてそうな気がします・・・逃げないでー!笑😀

これ、査読の最初のほう、200件だけとかでもやっておくと、
自分は公報100件読むのに、何分くらいかかるのかわかりますよね。

また、公報を読む速さも結構変わってしまうものでして、
  ・ 技術テーマ
  ・ 図面で判別できる/できない
 ・ 読む対象は全文? 請求項だけ?
  ・ 公報発行言語
等の諸条件で 全然違うので、私は毎回作業記録とってます。

その結果「450件なら 今日、確実に終わるー!」ってわかります😍

私自身は「検索するのと、公報を読むのが仕事」なので、
一般的な知財担当の目線から見ると
「やりすぎ」な公報読み、かもしれないんですけど・・・😅 
少しでも役立ちそうな事がありましたらお使いください。
また「調査会社って、そんな感じで仕事してるのねー」と、
知って頂く機会にもなったら嬉しいです!


---
♡スキ!ボタンは誰でも押せます。
(noteユーザーでなくても!)
ポチッとして頂けると励みになります!

---
■他媒体では ここにいます
WEB: http://www.1smartworks.com/
Twitter: @s_misato
Facebook: sakai.misato
お問い合わせ先:info@1smartworks.com


この記事が気に入ったらサポートをしてみませんか?