見出し画像

『ユニコード戦記』レビュー

『ユニコード戦記』─文字符号の国際標準化バトル

小林龍生 (著)

ジャストシステムという会社があります。かつて、一太郎というワープロソフト(まだありますw)でぶいぶい言わせて、一太郎用の日本語フロントエンドプロセッサ(なんて今ではもう言わないとおもうけれど。IMEかな?)のATOKで、あらゆる(日本語での)文章書きのハートをわしづかみにして一世を風靡した、老舗の、特に日本語処理関係に超強い会社です。
そこに、教育雑誌の編集者(小学館で、かの『ドラえもん』担当編集者だったそう)だった筆者が転職してきたのは1989年。ようやくパソコンで日本語がなんとか(といってもかなり苦労しながら)扱えるようになってきたころです。

ジャストシステムに入社した直後に浮川社長が案内してくれた本社の試験部門で、膨大な数のプリンターがずらりと並んだ光景に度肝を抜かれたことを今でも鮮明に覚えている。そのころは、CPUの処理速度や記憶装置の容量の関係で、PC側にもプリンター側にもビットマップフォントをROMに焼いて搭載しておき、今からは想像もつかないほど遅い通信経路で文字符号をやりとりしていた。
場合によっては、JIS第2水準用の漢字ROMはオプションなどという機種も存在していた。そして、PCとプリンターに搭載されていた漢字ROMがメーカーによって、いや場合によっては同じメーカーでも事業部がちがったりすると、新JIS対応やら旧JIS対応やらバラバラの状態だった。
そのため、CRT上で見た文字と印刷された文字の形が異なることなど日常茶飯のことだった。そのような機種に依存した相違を、若いテスティング・エンジニアたちが膨大な時間を費やして総当たり的にチェックしていたのだ。

P.54より。「ぼくが文字コード規格の戦場に抛り出されたのは、そんな時代だった。」

ここでちょっと長くなりますが背景情報など。

文字コード、むつかしいお堅い言い方をすれば符号化文字集合標準ってやつです。
コンピュータ上で文字を扱う際に、必ず必要になってくる、目で見える文字それぞれに割り振られた番号でありコードのこと。これがあいまいだったり食い違っていると、別のコンピュータでは文字が入れ替わってしまって(いわゆる文字化け)暗号のようになりまともに読むことができなくなります。
たとえ同じコンピュータであっても、エンコード方式(コード化すること。その逆はデコード)が違っていたら化け化けになってしまうのは、日本語でコンピュータをちょっとでも深く扱えば、わりとすぐにぶつかる問題だったりします。

この本の著者が文字コード規格の戦場にほおり出されたのは、まだこの文字コード集合が世界で統一されていない時代でした。

欧米で開発されたASCIIコードという1バイト、つまり8ビットであらわされる、256文字の英数字(とちょっとした記号)程度の「共通語」は当時からなんとかあったものの、それに拡張に拡張を重ねて作られた2バイトコード、旧JISだの新JISだの、EUCだのが国内だけでも乱立していた時代。(Shift-JISとかもあったねー)
海外に目を向ければ、ともに漢字を使う、中国、日本、韓国の2バイト文化圏が「このコード(数字)にはこの文字」と統一しようという動きがありました(中国、日本、韓国の頭文字をとってCJK統合漢字という)。
当然これを統合・統一できれば、通信はもとよりコンピュータを基本とした各産業に与えるメリットは計り知れないものがあります。
が、しかし、各国の思惑はやはりバラバラで、主義主張のぶつかり合いは激しく、なかなか統一することができません。
一方、たった1バイトの英数字だけですべてを表現できる英語圏からは、「2バイトもあれば全世界の文字余裕で統一できるでしょ」なんていう楽観的な論文が

ジョー・ベッカーによるユニコードの概念を書いた歴史的論文”Unicode 88”のリプリントより(本書P.201)

だされており、このままでは「漢字を使わない文化圏の者に、母国語の漢字コードを決定されてしまう」事態が発生してしまいます。

「白」と「臼」とか、見た目似てるし英語圏の人には見分けつかないから同じコード割り当てでオッケーね! なんて一方的に定義される可能性があったわけです。もちろん彼らに悪意があるわけではなく、将来の産業的なメリットのために好意でいってくれているのでしょうが、そうした文字を日常的に使っている側からすると余計なお世話ですし、食い違う文字を名前なんかに使っていたらアイデンティティにかかわる大問題になってしまいます。

そのような危機的時代に、国際標準化会議の戦場に、国内の漢字システムインテグレータの雄であるジャストシステムから送り込まれた刺客が、この本の著者、小林龍生さんだったわけです。

本書のタイトルに「戦記」なんて書かれているのはどうなの? なんて手に取る前は思っていたのですがとんでもない。
国際会議は、各国の思惑が飛び交いぶつかり合うまさに戦場なのでした。

付録1:用語解説より
↑用語解説にこんなのがでてくるぐらい(笑)

そのような戦場に、右も左も(そして英語も)わからない筆者が送り込まれ、いろいろと手痛い失敗や困難、障害にぶつかりながら、国際会議での戦い方、丁々発止の交渉力(そして英語力も)を磨き、成長を重ねてついには議長に就任。責任者として見事にユニコードを国際標準に定めていくまでの戦いの歴史の記録。それを戦記といわず何と言いましょう。
その戦いの数々のエピソードが、一人称で赤裸々に語られているのです。

※ユニコードとは直接関係ありませんが、氏の戦いで武器となった、英語の学習方法にもかなりスペースを割いて解説してくれています。巻末の資料を含め、国際社会での戦いを目指す英語学習者にはとても参考になりそうです

前述のガンマン十戒にも言えるかも?

我々一般の利用者ユーザーは、こうした技術の裏で行われてきた「戦い」の歴史を知りません。
しかし、その恩恵は常に(いまこの文章を書くことでも、もちろん読むことですら)得てきています。
頭の良いえらい人たちがいいかんじに決めてくれるんでしょう? なんて無関心でいたら、(今のどっかの国の政治みたいに?)とんでもないことになってしまいます。
実際、本書にはこうした国際会議を上手く乗りこなせずに、少々可哀そうなことになってしまった国の例もでてきます><

日本語の話者として、漢字という表意文字文化圏の人間として、世界を舞台に人知れず長く苦しい戦いを戦い抜いた筆者とその戦友たちには、本当に頭が上がりません。尊敬と、感謝をささげたいと思います。おつかれさま&ありがとうございました。

なお、本書は筆者と共に戦った戦友であり相棒だった樋浦秀樹氏に献辞されれています。

本書献辞

ヒデキ氏はこの戦いの当初から筆者と共にあり、ユニコード技術標準Unicode Technical Standardの成立を見たのち、2010年4月7日、癌により急逝されました。

訃報:ソフトウェアの国際化に貢献、樋浦秀樹氏

謹んでご冥福をお祈り申し上げます><

この本は、著者、小林龍生さんの戦いの歴史であり、バディとして最後までともに戦ったヒデキ氏の戦いの記録でもあるのです。

◇ ◇ ◇ 


追記:

日本語、漢字を中心視点で書きましたが、世界には漢字だけでなく

本書p.74より

こんな文字の言語もあります。
こうした文字文化圏の意見も取り入れながら進めていくのですから、国際会議は簡単にはまとまらないのはわかりますね><
また、そうした文字すらも統一されたコードマップで扱えるわけですから、ユニコード自体はとても有用で、すばらしい技術的な成果と、国際的な協調の到達点であると思います。


#小林龍生 #樋浦秀樹 #ユニコード #標準化 #国際会議 #英語学習 #らせんの本棚

よろしければサポートお願いします!いただいたサポートはクリエイターとしての活動費にさせていただきます!感謝!,,Ծ‸Ծ,,