見出し画像

[作業メモ]”非英語”の公報テキストをスムーズにブラウザ翻訳

こんにちは!特許調査の仕事をしてます、酒井といいます。この記事は、非英語の公報テキストをスムーズにブラウザ翻訳させるメモです。
「特許公報をたくさん読む時の工夫」↓ のおまけ編になります。

「非英語公報 ×  ブラウザ翻訳」の問題点

ここでは
Google Patents × 非英語公報 × Chromeブラウザの翻訳、の例で書きます。

たとえばここ(リンク先)に中国語の公報があります。
こちらをブラウザプラグインのGoogle翻訳にかけようとすると、
Google Patentsの基本的な枠(ページ構成??)が英語、と認識されるのか、翻訳機能は「英語⇨日本語」を提示してきます。

もちろん、このままでは日本語で読むことはできません。
もし、このページを翻訳させるなら、︙ の箇所から「英語のページではない場合」を選択し、「中国語」を選択すればOKですが・・・ですが・・・?

中国語、かなり下の方にあるんですよね・・・
1件だけ読むなら我慢もするけど、たくさん読むには面倒です。

ここまでGoogle Patents×Chromeの例で説明しましたが、
「勝手に英語のページと認識される」点では、Espacenetも同様です。

たくさん読むために「公報言語を自動認識させたい!」

みなさん、このようなレイアウトの翻訳画面、見たことありますか?
じつは下記画面だと「元の言語」と「翻訳する言語」を任意指定できるんですよー。

こちら⇩はサンプルデータです。
一番右手「翻訳用URL」お試しください。

Google Translate 言語指定 URLの説明

サンプルデータ内のURLは下記のような構造になっています。
ざっくり言うと、前半がGoogle翻訳 / 後半が翻訳対象ページURL です。

https://translate.google.com/translate?hl=&sl=zh&tl=ja&u=https://patents.google.com/patent/CN108719540A/zh

真ん中に挟まっている、この文字列⇩が言語指定で
    sl=zh&tl=ja

sl= がソース言語(元の言語)
tl= が翻訳する言語 です。

というわけなので、
公報発行言語を特定し、sl= の後に入るようにして URLを作ったらOK!

あとは「たくさんURLを開くプラグイン」などで
まとめて処理がおすすめです。
https://note.com/sakaimisato/n/nd15a7d5c5e6d

それでは!

--- 
♡スキ!ボタンは誰でも押せます。
(noteユーザーでなくても!)
ポチッとして頂けると励みになります!

--- 
■他媒体では ここにいます 
WEB: http://www.1smartworks.com/ 
Twitter: @s_misato 
Facebook: sakai.misato 
お問い合わせ先:info@1smartworks.com

この記事が気に入ったらサポートをしてみませんか?