見出し画像

「住所翻訳機能」がリリースされました!住所の機械翻訳時に起こる誤訳や表記揺れを補完!

皆さん、こんにちは。WOVN PMM の小林です。

弊社は「世界中の人が、全てのデータに、母国語でアクセスできるようにする」というミッションを掲げ、Web サイト・アプリ多言語化ソリューション「WOVN.io」「WOVN.app」等の開発、運営を行っています。

世界各国でデジタルシフトが進み、サービスの国際化が余儀なくされる中で、企業の海外戦略の実現及び、多言語化における課題の解消を行い、現在まで15,000サイト以上にサービスをご利用いただくまでになりました。

本 note では主にリリース情報を発信し、機能の魅力やトレンドをお伝えします。

第一回目の今回は2020年3Qでリリースされた、住所の機械翻訳時に起こる誤訳や表記揺れを補完する「住所翻訳機能」についてご紹介させていただきます。

概要

日本の住所表記は同じ漢字表記で読み方が違う場合もあり、機械翻訳では誤訳や表記揺れが生じやすい課題があります。

以下は同じ住所情報に対し区画情報有無ごとにそれぞれを Google 翻訳したものですが、表記揺れが生じています。

▼パターン1:区画無し

スクリーンショット 2020-11-17 17.23.24

▼パターン2:区画有り

スクリーンショット 2020-11-17 17.23.46

言語変換としては双方問題なく通じ、例えば郵便に出した場合、宛先に届く可能性は高いとのことです。一方で、Web サイトやアプリ上で表記揺れがあった場合、運営面やユーザービリティの観点で混乱を招くかもしれません。

また、人力における翻訳作業においても、大量のページに存在するテキスト情報を収集し、誤訳や表記揺れを確認した上で、プロの翻訳者へ依頼。納品された翻訳情報を Web サイトやアプリへ反映させる為、今度は運営担当者や製作会社へ依頼するなど多くの労力を必要としてきました。

WOVN.io では Web サイトやアプリで生じていた「住所翻訳」における課題を踏まえ、独自のマスターデータにより日本の住所表記の機械翻訳を補完する「住所翻訳機能」をリリースいたしました。

活用イメージ

「住所翻訳機能」を有効化後、機械翻訳を実施することで対象となる情報に本機能が自動適用されます。

▼パターン1:区画無し

画像3

▼パターン2:区画有り

画像4

「住所翻訳機能」が適用対象となる情報は以下になります。

・都道府県・市区町村・町域の3要素が隣り合って表記されいている
 例:神奈川県横浜市港北区大豆戸町

・都道府県・市区町村の2要素が隣り合って表記されている
 例:神奈川県横浜市港北区

・市区町村・町域の2要素が隣り合って表記されている
 例:横浜市港北区大豆戸町

・政令指定都市
 例:横浜市港北区

住所情報は以下の形式で翻訳されます。

・ヘボン式ローマ字
・長音はマクロン記号( )を表記(都道府県を除く)
・順序は日本語と逆の表記
・カンマ区切りで -ku, -shi を表記
・都・府・県の接尾辞は省略(道のみ省略しない)
・市区町村の接尾辞は省略せずハイフン区切りで表記
・表記は全て英語表記(ローマ字表記)

例:

元住所:神奈川県横浜市港北区大豆戸町1丁目2-3
適用後:1-2-3 Mamedochō, Kōhoku-ku, Yokohama-shi, Kanagawa

お問い合わせ

ご契約企業様:担当までご連絡ください。
上記以外の場合:こちらのフォームからお問い合わせください。担当よりご連絡いたします。