見出し画像

AIをIPLに活用できるか?  知的財産業務✖️AI(→IPLに活用)を考える。

○はじめに

この記事には個人の意見が入っている場合があります。よろしくお願いします。

4月から知財関係の業務に就くことになったので、主に特許関係の勉強をしつつ、空き時間で前職で行なっていた機械学習関係の勉強を自然言語処理にシフトして2本柱でキャリアを進めている。

知財の中でも「特許」を中心に考えていくことが多くなることから、これら特許情報とディープラーニング(ここでは、機械学習全体もを含める)をうまく使い、ビジネスを生み出す技術を作れないか、IPL(IPランドスケープ)に活用できないかと考えている。
今回はその周辺技術について調べた結果や勉強会で知った内容を触れたい。

○特許文献調査への応用

 まず、IPLとは遠いようで近い特許文献調査に着目してみる。IPLを行うための土台を構築するための前準備に必要ではあるから本筋とは逸れていないはず。。。

 研究開発を行う前、特許を出願する前、他社に特許侵害された時などに特許調査業務は行われる。簡単に分類すると、下記のような感じになる。

(1)技術動向調査
(2)先行技術調査
(3)侵害防止調査
(4)無効資料調査

 これらのような調査に対して、Deep Learningの活用が取り組まれている。
なぜ、活用されるのか?

####################################

 調査は簡易的に書くと下記のフローのように行われる。
 

画像1

 しかしながら、特許分類を行う・検索する際のキーワードの選択やスクリーニングで、時間的なコストがかかったり、経験や個々人のドメイン知識の差が検索の正確性・再現性の問題を生む。
 これらを解決するために、AI・機械学習・Deep Learning・自然言語処理の活用が行われている。これらを用いることで、自動的に特許を分類でき、サーチャーの個人差が反映されず、正確性(ここでの正確性は正答率と使用者の理想に近いかによる)・再現性が担保される。

 ちなみに機械学習を使った特許分類フローは例えば、

①特許データの取得
形態素解析を行い、文章を単語別に分け、データセットを作成。作ったデータに対して属性(分類クラス)を付与
③予測モデルの構築。→ 統計的手法・ディープラーニング・クラスタリング
④構築したモデルを未知データに使用する。

のような流れであろう。

 また、自然言語処理のみで考えると例えば、TF-IDF(Term Frequency(TF)と、Inverse Document Frequency(IDF)のこと。文書の中から、その文書の特徴語を抽出する時に使う値)などの手法もある。

○特許情報活用に期待される技術

 上記のような場面でどのような技術が使われるかをまとめた。(どれも代表的技術である。)

特に参考にした書籍を紹介しておく。


以下は技術詳細である。

形態素解析
単語を文法的に分割する手法のこと。
代表ツール例
日本語:Mecab、JUMAN、JANOME
英語:TREE TAGGER、NLTK

例を下図に示す。

画像3

予測モデル

Word2vec

GoogleのMikolov氏の有名な論文の技術。自然言語処理✖️Deep Learningの皮切り役だと思う。各単語の意味をベクトル化する手法である。自分で実装実験も行なった。

画像2

(参考程度に検討に使ったコードを置く。)

特許分類はしっかりとできることを確認できた。問題はテーマ設定だと考える。文章がポジティブなのかネガティブなのかを分類する題材は有名だが、奥行った表現を分類するのはテーマによって正答率が大きく異なっていくだろう。

BERT

Word2vecの発展系。自然言語処理ではトレンドになっており、これらの技術が今後特許アプリケーションにも加わってくるだろう。

画像4

Attention

Attentionとは、
・モデルが推論を行った際に入力のどこに注目していたのかをユーザに表示することが可能。
・BERTモデルに導入されている。

このattentionを利用すれば、学習モデルから重要とわかったキーワードを利用し、検索式立案に活用できると考える。詳細は割愛。

○IPLに活用できるか?

 AIをIPLに活用できるか?ビジネスに活用できるのか?
 最近多くのAI✖️特許データベースソリューションリリースされていることはご存知であろうか?


 特許価値評価機能(Patentsight社など)は、Word2vecなどを用いれば、同じことができそうではある。評価指標をどう定めるかが問題でまだそれが思いつかない。(例えば、米国出願をしていれば、+1点とか?) また、俯瞰マップ(Orbit社など)も経営戦略の意思決定に活用できそうである。

その他の用途はこれから発展していくだろう。逐次技術動向のチェックを必要とする。また、何かあれば記事を書きたいと思う。

 上記のようなものがIPLに対して、本当に活用できるのか?私はこれらを用いた経営戦略の意思決定フレームワークを考えられたらいいなと考えている。


○まとめ

・特許情報の活用に機械学習・AIを利用した自然言語処理が使われ始めている。
・自然言語処理の流れ
 形態素解析→構文解析→意味解析→文脈解析→文書分類
・現在の技術動向はディープラーニングの発展に伴い、激しく動いている。  
 word2vec elmo BERT等
・AIをIPLに活用できるか?
 →特許価値評価や俯瞰マップは使えそう。その他の用途はこれから発展していくだろう。逐次技術動向のチェックを必要とする。また、使用することだけではなく、経営戦略の意思決定のフレームワークに組み込むことが大切である

以上

その他参考)
機械学習を用いた効率的な特許調査方法 文書のベクトル化方法と文書分類への応用 
https://arxiv.org/abs/1706.03762


★2020/08/02 加筆修正




この記事が気に入ったらサポートをしてみませんか?