[作業メモ]”非英語”の公報テキストをスムーズにブラウザ翻訳
こんにちは!特許調査の仕事をしてます、酒井といいます。この記事は、非英語の公報テキストをスムーズにブラウザ翻訳させるメモです。
「特許公報をたくさん読む時の工夫」↓ のおまけ編になります。
「非英語公報 × ブラウザ翻訳」の問題点
ここでは
Google Patents × 非英語公報 × Chromeブラウザの翻訳、の例で書きます。
たとえばここ(リンク先)に中国語の公報があります。
こちらをブラウザプラグインのGoogle翻訳にかけようとすると、
Google Patentsの基本的な枠(ページ構成??)が英語、と認識されるのか、翻訳機能は「英語⇨日本語」を提示してきます。
もちろん、このままでは日本語で読むことはできません。
もし、このページを翻訳させるなら、︙ の箇所から「英語のページではない場合」を選択し、「中国語」を選択すればOKですが・・・ですが・・・?
中国語、かなり下の方にあるんですよね・・・
1件だけ読むなら我慢もするけど、たくさん読むには面倒です。
ここまでGoogle Patents×Chromeの例で説明しましたが、
「勝手に英語のページと認識される」点では、Espacenetも同様です。
たくさん読むために「公報言語を自動認識させたい!」
みなさん、このようなレイアウトの翻訳画面、見たことありますか?
じつは下記画面だと「元の言語」と「翻訳する言語」を任意指定できるんですよー。
こちら⇩はサンプルデータです。
一番右手「翻訳用URL」お試しください。
Google Translate 言語指定 URLの説明
サンプルデータ内のURLは下記のような構造になっています。
ざっくり言うと、前半がGoogle翻訳 / 後半が翻訳対象ページURL です。
https://translate.google.com/translate?hl=&sl=zh&tl=ja&u=https://patents.google.com/patent/CN108719540A/zh
真ん中に挟まっている、この文字列⇩が言語指定で
sl=zh&tl=ja
sl= がソース言語(元の言語)
tl= が翻訳する言語 です。
というわけなので、
公報発行言語を特定し、sl= の後に入るようにして URLを作ったらOK!
あとは「たくさんURLを開くプラグイン」などで
まとめて処理がおすすめです。
https://note.com/sakaimisato/n/nd15a7d5c5e6d
それでは!
---
♡スキ!ボタンは誰でも押せます。
(noteユーザーでなくても!)
ポチッとして頂けると励みになります!
---
■他媒体では ここにいます
WEB: http://www.1smartworks.com/
Twitter: @s_misato
Facebook: sakai.misato
お問い合わせ先:info@1smartworks.com
この記事が気に入ったらサポートをしてみませんか?