欧州諸国特許の全文テキストを取得したい

THE調査力では日本特許の全文テキストを自動取得する機能が用意されていますが、海外特許の全文テキストをTHE調査力に取り込むためには、商用特許データベース(検索システム)の画面表示を使用して、1件ずつコピー・ペーストするしか方法がありません。

そこで下記のnote文書でUSPTO(米国特許商標庁)から全文テキストを取得してTHE調査力にインポートする方法を紹介しました。

この文書では欧州特許庁が運営するOPS(Open Patent Service)を使用して、欧州諸国特許の全文(Description)テキストを取得する仕掛けを紹介します。

下図はOPSのReference Guideに記された内容です。OPSでは30か国(機関含む)もの特許のDescriotionテキストを取得できるようです。30か国の中にどうしてCA(カナダ)が含まれているのか、コテコテの欧州のはずのDE(ドイツ)がどうして除外されているのか、色々と不可解な点もありますが、とりあえずはひとつのAPIを駆使するだけで30か国もの情報を得られることに感謝です。

次の文書から「THE調査力OPS全文取得ツール.xlsm」をダウンロードしてExcelで開いておいてください。

全文テキストを取得したい案件集合について、図の6つのフィールドの情報を「Excel出力」してください。ここでTHE調査力からダウンロードされたファイルの情報を元にDOCDBから全文テキストを取得し、THE調査力にインポートするためのTSVファイルを生成します。

THE調査力からExcelファイルのダウンロードが終了したら、ファイルのアイコンを「THE調査力OPS全文取得ツール.xlsm」の画面にドラッグ&ドロップしてください。

THE調査力からダウンロードしたファイルの「出願番号」セルを選択してください。

続いてAlt+F8キーを入力し、マクロ「THE調査力OPS全文取得ツール.xlsm!OPS全文取得」を選択して「実行」ボタンをクリックします。

選択した案件についてDOCDBから全文テキストが取得され、THE調査力からダウンロードしたファイルと同じフォルダに、「OPS全文yyyymmddhhmmss.tsv」の名称のTSVファイルが生成されます。さらにテキスト取得が正常に終了した案件のセルは薄緑色に、取得できなかったセルは灰色に色付けされます。

続いてTHE調査力の「特許データの保存」により、生成されたTSVファイルをインポートします。

全文テキスト情報をはじめてインポートする場合には「書式ウィザード」をクリックします。

「ファイルを選択」ボタンをクリックし、ツールにより生成されたTSVファイルを選択して「読込み」ボタンをクリックします。図のようにプレビュー画面が表示されたらウインドウ右上の「次へ」ボタンをクリックします。

データの発行国を指定する画面まで「次へ」のクリックを続け、ラジオボタンで「国混在」を選択して「国コード」列をクリックしたら、「次へ」をクリック。

図の画面が表示されるまで「次へ」操作を続け、「この書式を登録しますか?」に対して「はい」をクリック。新たに登録する書式名にたとえば「全文テキスト」と名付けて「登録」ボタンをクリックします。

書式設定が完了したら「はい」をクリックして取り込みを開始します。

しばらく待つと、DOCDBから取得した全文テキストがTHE調査力のタイトルに取り込まれます。取り込む情報は全文テキストという、そこそこサイズの大きいデータです。「THE調査力OPS全文取得ツール.xlsm」で全文テキストを取得する公報件数が多いときには、THE調査力へのインポート時にフリーズしてしまうことがあります。1回の取得件数は最大でも数百件程度に抑えておいた方が無難かもしれません。

なお一度「書式設定」したあとには、登録した書式を使用してインポート時の設定の手間を減らすことが可能です。書式登録をお勧めします。

OPSのAPIを使用してDescriptionを取得する際には、公報の種別を指定できないようです。案件によりA公報(公開公報)の文字列が取得されたり、B公報(登録公報)の文字列が取得されたりする気配です。また定量的な解析には至っていませんが、EP特許を各国に国内移行したT公報については、Descriptionが取得できない案件が目立ちます。

ところでINPADOCから経過情報を取得する際には、ESPACENETで表示される形式(EPODOC形式)の公報番号文字列が必要になります。一方、THE調査力の公報番号フィールドは、ユーザが「特許データの保存」を行った際の、そのままの文字列が入っているため、表記形式によってはINPADOCが正しく認識してくれないことがあります。ある程度の表記揺れには対応しましたが、正しく動作しない公報番号があるはずです。法律状態を取得できない場合には、使用している公報番号文字列を、ページ下部の「クリエータへのお問合せ」から連絡してください。

2024/04/11 作成


この記事が気に入ったらサポートをしてみませんか?