見出し画像

はじめての特許出願【デジタルアーカイブの取り組み】

こんにちは。メディア研究開発センター(M研)の嘉田です。
いきなりですが…

私の発明、特許を取得しました!
ということで、今回のテックブログでは、M研の仲間2人とともに生み出した発明の内容と、特許取得までの道のりをご紹介します。

ちなみにM研発の発明は過去に2件の特許を取得しているので、本件で3件目となります👇
校正:https://www.j-platpat.inpit.go.jp/c1800/PU/JP-2019-016140/86DB7FCA375F25A73DADB4B640478AE4FB7D0BEB0BA80C259FD21BACE22DB843/11/ja
要約:https://www.j-platpat.inpit.go.jp/c1800/PU/JP-2022-027175/8B33949B94DCDFA91BA21D9EE8A4608CE3C6A5B4D90C6BF31F8576A82ADA84AA/11/ja

どんな特許?

M研では「紙面デジタル復刻」というプロジェクトを進めており、今回取得したのはそれに関する特許です。
紙面デジタル復刻プロジェクトは、AIを活用して過去の新聞紙面の記事をデジタルデータとして抽出することを目指しています。
朝日新聞は140年以上の歴史がありますが、全ての記事がデジタル化されているわけではなく、紙面画像のデータしかない記事が多数存在します。
そのような紙面を自動でデジタル化して、データベース事業等で活用できるようにしよう!というのが本プロジェクトのゴールになります。

記事データの抽出は下記のフローで実現しています。

データ作成のフロー
右が結果画像で、枠の色が1記事を表し、本文内の数字は読み順を表す

紙面画像からテキストデータを抽出するためにOCRを利用していますが、その前段として見出し・本文といった記事の構成要素の領域を取得する処理(記事領域取得)を行っています。これによりOCRの精度が良くなります。
またOCRをするのみならず、見出し・本文・画像などの領域をグルーピングして記事毎にまとめあげ、本文についてはその読み順を特定することで1記事の情報を作成します(記事連結)。
さらに、データベースに格納するにあたり、メタデータの付与まで完全自動で行います。
これらの処理によって、画像右のような結果が得られます。

新聞のレイアウトは非常に複雑で、今回のデータ作成は万能な機械学習モデル1つでうまくできる!といったタスクではありませんでした。
特に記事連結プロセスは画像処理・自然言語処理・ルールベースなど様々な技術を駆使して精度良く実現できています。

そして、この記事連結プロセスにおける技術で特許を取得することができました🎉
かなり試行錯誤しながら開発した部分だったので、報われた気分です。
詳細は特許情報プラットフォーム(J-PlatPat)に掲載されていますので、気になる方は下記をご覧ください。
https://www.j-platpat.inpit.go.jp/c1800/PU/JP-7385075/1CEC7BB3FE8F31D4C509CA52B279F86BA3B73AB9380BB26ED1D35E41AB96B0AF/15/ja

また、本プロジェクトは弊社のデータベース事業部門と協力して進めており、近々朝日新聞クロスサーチに「地域面検索β版」として上記フローで作成したデータが公開される予定です。
1991~1996年の地域面のデータが記事・広告あわせ約390万件、新たに全文検索が可能になります。お楽しみに!

取得までの道のり

最初に、本件は職務発明(従業員が会社での職務の範囲内で行った発明)であり、特許法に従って権利関係は下記のとおりになります。
・特許を受ける権利は会社に帰属する
・発明した従業員には相当の利益が付与される
これに対応して弊社では職務発明規定が制定されており、出願時・特許権登録時のほか、特許が生み出す利益に応じて算定する実績報奨金も用意されています。特許を使って会社が利益を得れば、私たち発明者へのリターンもどんどん増える仕組みです😏

それではここから、特許取得にいたるまでを時系列順にご紹介します。
なお、一般的な特許取得までの流れは下記のとおりです。
通常これらの手続きや書類作成は弁理士に依頼しますが、会社で取る特許なので、弊社の知的財産部門が橋渡しして進めてくれました。

https://www.jpo.go.jp/system/basic/patent/index.html

2023年1月某日 「特許取れないかな。」

前述のデータ作成フローが大方完成してきた、という段階での上司のつぶやきがきっかけです。
当時の心境はというと、やっていることはすごいものの、既存技術の組み合わせがメインだったので、特許を取れるポイントはあるのだろうか…と不安に思っていました。
とはいえ、「特許発明者」という肩書きも悪くない😏という気持ちから、特許に挑戦することにしました。

まず着手したのは、弁理士への説明資料の作成です(詳しくは後述)。
フローの構成要素が多く、それぞれ詳細を記す必要があったため、かなり時間がかかりました。

⚠出願前に論文発表などで技術を公表すると、原則特許を受けることができなくなります。公表後1年以内であれば新規性喪失の例外規定を適用できるようですが、手続きが増えるので注意です。
https://www.jpo.go.jp/system/laws/rule/guideline/patent/hatumei_reigai.html

2023年4月〜 知的財産部門&弁理士とのやりとり

知的財産部門に相談すると、情報処理を専門とする弁理士を紹介されました。「特許の可能性あり」とゴーサインをもらい、本格的に出願に向けて動き出しました。

実際にやったことは下記のとおりです。

  1. 弁理士への手法説明

  2. 特許を取れそうなポイントの洗い出し ←弁理士

  3. 先行技術調査 ←弁理士

  4. 出願書類の作成 ←弁理士

列挙するとわかりますが、ほぼ何もしていない…。
大変だったのは1のための資料作成と、4で弁理士に作成してもらった出願書類の確認くらいでした。出願書類は特許のお作法が満載で、確認にはかなり時間がかかりました。

2023年06月28日 出願

早期審査制度を利用しました。
この制度を使うと、通常の出願では9~11ヶ月かかる一次審査通知までの期間が、2,3ヶ月に短縮されます。詳しくは下記などを参考にしてください。
https://www.jpo.go.jp/system/patent/shinsa/soki/v3souki.html
⚠特許事務所に追加の費用を支払う場合が多いです。

これによって出願から2,3ヶ月で特許取得にいたるのかというと、そんなに甘くはありません。
弁理士によると、一次審査で特許査定が出ることはほぼほぼなく、約9割は拒絶されるとのことでした。

2023年08月15日 (予定通りの)拒絶

(大事なことなので2回目)9割は拒絶される…。
わかっていたことなので特にショックではありませんでした。
(といいつつ、本当は少しだけ期待していました。そんなにうまくはいきません。)

拒絶された場合、拒絶理由通知に記載された内容に反論したり、特許請求の範囲を手直ししたりすることで拒絶理由を解消していくというプロセスを踏みます。今回は合わせ技で対応しました。
このあたりの方針は弁理士に従うのが吉です。
文言を少し修正するだけでOKだったりするので、素人には何もわかりません…。

2023年10月10日 特許査定

二次審査にてめでたく特許査定をいただきました!
出願から約3.5ヶ月後でした。
登録料を納めて2023年11月13日、正式に特許が登録されました!
一連の手続き含め、知的財産部門や弁理士におんぶにだっこで進み、自分がメインでやったことは最初の資料作成くらいでした…。
関係者の皆様、私たちを特許発明者にしていただき誠にありがとうございました。

おわりに

まさか自分が特許に関わることになるとは、プロジェクトが始まったときには想像もしていませんでした。
また、当初は特許査定まで1~2年ほどかかると思っていたのですが、蓋を開けてみると出願から3.5ヶ月という短期間で決着がつきました。
早期審査請求おそるべし。
みなさんも特許、考えてみませんか?

(メディア研究開発センター・嘉田紗世)