見出し画像

百度百科の「中国」

百度百科とは中国のウィキペディアのようなWEBサイトで、百度という中国のGOOGLEのような検索サイト最大手の企業が運営している百科事典のようにあらゆることがらの解説記事が中国語で収録されています。なぜ中国でウィキペディアのようなものやGOOGLEのような検索サイトが独自に発展しているのかと言えば、それはもう中国では当局の規制によってウィキペディアやGOOGLE検索に容易にアクセスできないようになっているので、似たような機能を提供する自国のサービスが定着していったものでしょう。


以前にAI技術で中国語を読んでみたという記事で中国語の本から画像認識で文字として読み取り、自動翻訳にかける。という作業をしてみました。

その結果としては、自動翻訳で翻訳された日本語がかなり分かりずらいもので、英語→日本語の自動翻訳に比べて中国語→日本語はまだまだ精度が低く、実用には使いずらそうだ。というニュアンスの総括となりました。

しかしその後、この「百度百科」の記事や、新華社(中国の国営通信社)のWEBサイトの記事や、中国人民銀行(中国の中央銀行)のプレスリリースなどを翻訳にかけてみると、「だいたい分かる。むしろ単に自動翻訳した結果としては英語よりわかる割合が大きいかも知れない。」という感想です。

なぜそのような落差が生じたのかというと、予想としては先に読もうとした本がもともと1940年刊行の歴史書ということで、そもそも現代人にとっては中国語としても読みずらく、さらに現代の言葉を参照データとして使っている自動翻訳でいい結果を得られないのではないかと思われます。

例えば、

タイの法律に​​よれば、各訪問者はたった1本のタバコと1本のワインを持ち込むことが許可されています。さらに、電子タバコはタイでは禁止されており、タイで電子タバコを持ち運び、使用、輸入、輸出、販売することは違法です。
大使館はまた、タイの環境保護規則を順守し、関連するビーチで喫煙したり、海洋動物を捨てたり、サンゴを踏みつけたり、海洋環境を破壊したり、海洋環境に損害を与えないよう注意を促します。そうでなければ、タイの法律に​​従って罰金または投獄される可能性があります。
タイのメディア報道によると、タイでは最近、仏教カードやお守りを使って外国人観光客をだましていることがわかりました。大使館は、訪問者にブッダのカード、お守り、その他の商品を慎重に購入するように特に注意を促します。

以上の文章は新華社の中国語の記事を日本語に自動翻訳しただけで全く手を加えていないものですが、少し不自然な点はあるもののそれと言われなければ分からないかもしれないくらい十分精度の高い翻訳であるように思います。


今回は、中国のウィキペディアこと百度百科で「中国」がどのように記述されているか読んでみます。なお同時に、自動翻訳+WEB検索によって中国語が読み書きも全くできない人がWEB上の中国語をどの程度理解することができるかどうか、現代の技術レベルの実践でもあります。

なお「中国」の記事は全体で印刷15頁、少なくとも1万字以上に渡るものですが、ここでは導入部(アウトラン)の部分を確認します。


==================================

中国 (世界四大文明古国之一) 
声明
本词条介绍的是历史与文化意义上的中国,关于现今中国,请查阅“中华人民共和国”词条。

中国(世界の四大古代文明の1つ)
声明(注1)
このエントリは、歴史的および文化的な意味での中国を指しますが、今日の中国については、「中華人民共和国」エントリを参照してください。

中国,是以华夏文明为源泉、中华文化为基础,并以汉族为主体民族的多民族国家,通用汉语、汉字,汉族与少数民族被统称为“中华民族”,又自称为炎黄子孙、龙的传人。

中国は、中国文明を源流、中国文化を基礎として、漢民族を主な民族とする多民族国家です。漢語と漢字が使用され、漢民族、少数民族を総称して「中国民族」と呼び、彼らは自身を炎黄の子孫(注2)・ドラゴンの後継者と呼んでいます。

中国是世界四大文明古国之一,有着悠久的历史,距今约5000年前,以中原地区为中心开始出现聚落组织进而形成国家,后历经多次民族交融和朝代更迭,直至形成多民族国家的大一统局面。20世纪初辛亥革命后,君主政体退出历史舞台,共和政体建立。1949年中华人民共和国成立后,在中国大陆建立了人民代表大会制度的政体。

中国は世界の四大古代文明の1つであり、長い歴史があります。約5,000年前、中央平原地域から始まって、集落組織は国を形成し始めました。その後
多くの民族の混血や王朝の変化があったのちに、多民族国家として統一された状況となります。20世紀初頭の辛亥革命後、君主制は歴史の舞台を退出し、共和制となります。1949年の中華人民共和国の成立後は、中国大陸では人民代表大会制度の政府が設立されました。

中国疆域辽阔、民族众多,先秦时期的华夏族在中原地区繁衍生息,到了汉代通过文化交融使汉族正式成型,奠定了中国主体民族的基础。后又通过与周边民族的交融,逐步形成统一多民族国家的局面,而人口也不断攀升,宋代中国人口突破一亿,清朝时期人口突破四亿,到2005年中国人口已突破十三亿。

中国には広大な領土と多数の民族があります。秦以前の華夏の人々は中央平原地域で栄えました。漢の時代、文化交融(注3)を通じて漢民族が形成され、中国の主要な民族の基礎が築かれました。その後、周辺民族との交融により、統一多民族国家の状況が徐々に形成され、人口も増加しました。宋王朝の中国の人口は1億人を超えました。清王朝の人口は4億人を超えました。2005年までに、中国の人口は13億を超えました。

中国文化渊远流长、博大精深、绚烂多彩,是东亚文化圈的文化宗主国,在世界文化体系内占有重要地位,由于各地的地理位置、自然条件的差异,人文、经济方面也各有特点。传统文化艺术形式有诗词、戏曲、书法、国画等,而春节、元宵、清明、端午、中秋、重阳等则是中国重要的传统节日。 [1-7]

中国文化は長い歴史を持ち、深遠で色彩豊かで、東アジア文化圏の文化的宗主国です。世界の文化の体系において重要な位置を占めています。地理的位置と自然条件の違いによって、各地の人文と経済の側面には独自の特徴があります。伝統的な文化芸術には詩、戯曲、書道、中国絵画が含まれます。春節、元宵節、清明、端午、中秋節、重陽節は中国の重要な祭りです。


(注1)
 ウィキペディアで同じ名前の記事が複数ある場合に何に関する記事なのかを注釈しているのと同じ意味と思われます。「中国(世界の四大古代文明の1つ)」とみると、突然どうしたことかと驚きますが、古代より歴史的文化的に一つのまとまりとして意識されてきたところの「中国」という意味であることを示している()書きということですね。
(注2)
炎黄の子孫とは、古代中国に炎帝と黄帝という伝説上の皇帝があって、その子孫であると自己規定しているという中国の人のアイデンティティの1つのようです。
(注3)
「交融」は百度百科によると「形容事物的交汇融合。也指不同思想、不同民族、不同文化的交往、融合。」とあり、交じり合って融合する。という基本的意味があって、特に異なる思想や民族や文化が融合することを指す言葉ということです。本文の自動翻訳では「統合」と出ますが、ちょっと意味合いが違う(中国の視点では、強制力を感じさせる日本語の「統合」よりも物事の流れとして自然にそうなったような「交融」の方が望ましそう)と考えられ、また日本語としてもそのままで分かりそうなので交融のままにしました。
==================================

やってみた作業の感想としては、自動翻訳に手を入れた方がいい箇所は少なくはないものの、時間さえかければおそらく意味内容としてはこれで大きな問題はないだろう。という程度の日本語にすることは、日本人にはそれほど難しくないように思います。

中国語の場合は、場合によっては漢字1文字ずつまで分解して1文字の意味を検索にかけていけば、漢字の数文字の連なりの意味内容がほとんどの場合で察することができるので、その積み重ねで文全体も理解していくことができます。この点は表意文字の強みであり、また漢字圏の人間の強みになりそうです。


記事の内容の感想としては、やはり現代の政治体制を反映してかせずにか、漢民族の視点にたった記述になっているのかなという印象は受けます。歴史的には漢民族以外の民族の王朝が、地域としての中国の支配権を得た時代もありますが、漢民族以外の民族の具体的な名称は登場しておらず、漢民族が文化的交融を通じて主要な民族となってきた。という点に焦点があてられているように感じるところです。

ただし、大和民族が大多数であり続けた日本の日本人の感覚だと「どういう記述の仕方が普通なのかは良く分からない」ものでもあります。

最後のパラグラフで中国文化を大いに自賛するまとめ方なども、そんなに臆面もなく褒めたたえる修飾の仕方をするのかと、少し気恥しくなりますが、これも謙遜を良しとする日本の感覚なのかもしれません。






サポートいただいた金額は、面白そうなものやサービスに使ってレポートをしたいと思います