見出し画像

20030309 中国語メール

 最近、中国語の広告メールが多くなってきた。内容はどうせ「簡単にお金が稼げる」というようなものだろう。もともと読む気はしないのだが、中国語で書いてあるので更に読む気がしない。

 自動翻訳サイト$${^{*1}}$$を使って訳してみる手もあるが、届いたメールが文字化けしている場合がある。

 コンピュータで文字を表示するために使用する言語のそれぞれの文字に番号が付けられている。これはそれぞれの言語に特有である。文字コード$${^{*2}}$$と呼ばれている。漢字は種類が沢山あるため、番号を沢山用意しなければならない。ローマ字など漢字に比較して格段に文字の種類の少ない文字は1バイト文字$${^{*3}}$$と呼ばれている。1バイトとは二進数表記で8桁分である。2の8乗、「256番」まで番号が用意されている。ローマ字関連なら大文字小文字記号数字など全部あわせても256番まであれば、十分足りる。漢字は全く足りないから2バイト使う。従って2バイト文字$${^{*4}}$$と呼ばれている。

 中国で使う文字も2バイト文字になっているが、番号の割り振りが違うはずだ。日本語表示ではそのまま漢字がうまく表示されていても、恐らく中国語として意味が通じていないだろう。

 なぜ中国語のメールが来るようになったのだろうか。雑記草の中国語版二種類$${^{*5}}$$を公開したからだろう。

*1 SYSTRAN - Information and Translation Technologies
*2 The Web KANZAKI -- Japan, music and computer 日本語と文字コード
*3 1バイトコード文字
*4 PC View:1バイト文字
*5 20030214 自動翻訳サイト(2)

この記事が気に入ったらサポートをしてみませんか?