見出し画像

辻のしんにょうが一点だか二点だかってどうでも良いじゃん

ネットで久しぶりに辻のしんにょうは一点だか二点だかという話を見かけた。  JIS X0213 で例示字形が変わっていっとき大騒ぎになったやつだ。ただ、これって問題は包摂基準が一般に理解困難だってことなんだよね。

包摂基準の理解が問題

以前にツッコミを入れた情報システム学会の『「マイナンバー制度の問題点 と解決策」に関する提言』でも名寄せを困難にしている例として挙げられている「辻」の漢字。提言では「辻」についてはJISの変遷で文字コードが同じでも違う字形が印字されるのに、文字コードで突合すれば同じ名前と判断されてしまう。これは人間が目視で比較した場合と結果が異なって問題だとう趣旨のことが書いてある。
まぁ、気持ちはわかるがあまり正確な議論でもない。そもそも「辻」の一点、二点の文字コードが同じかは採用する符号化文字集合依存。確かに JISX 0213 では同じだけど、文字情報基盤のMJ文字図形集合では区別されている。
さらにいうと、 JISの包摂基準では一点と二点のしんにょうは「区別しない」ことになっている。同じ文字なのだから文字コードは当然同じだし、同じ文字だから入れ替わったとかいうことでもない。
目視と判断が異なるというのも、判断する人間が包摂基準を理解しているかどうかなのだ。JIS基準で比較しますという前提で、包摂基準を理解した上で目視比較すれば、辻は一点でも二点でも区別しないのだから当然「同じ」と判定される。
ようは、比較者が包摂基準を理解していない。もっというと、なかなか一般感覚では包摂基準が理解できないことが問題なわけだ。

行政事務標準文字

行政事務標準文字という新しい文字セットが出来ようとしている。さらに、既存の文字との同定サービスも始まるらしい。同定できるということは包摂基準も定義されたのだろう。詳しい情報は確認できないが興味深いところである。
とにかく、一定の文字セットの中で同じ文字か異なるか、人名で言えば同じ名前か違うのかは同定基準に照らして判断することとなるのだから。

辻なんて問題ではない

なんで「辻」がいつもも槍玉にあがるのか。 JIS X0213で例示字形が変わった文字は他にもたくさんあるのに。
まあ、画数が少なくて点の増減が目立つし、ぱっと見わかりやすいからだろう。

では、これはどうか?
以下の画像は「文字情報技術促進協議会」様の検索サイトを利用させていただいております。素晴らしいサイトをありがとうございます。(https://moji.or.jp/mojikibansearch/basic


この「たて」も例示字形が変わっているが文句言っているの聞いたことがない。理由は多分ほとんど区別つかないし実害なかったからだろう。フォントで見ればかろうじて区別つくが、手書きでこの二つを正確に書き分けられる人がどれほどいるか?
いや、それ以上に、書類などに手書きされた文字を正確に読み取ってこれを区別できるだろうか。行政事務標準文字ではおそらくこの二字は区別され、異なるコードが与えられる。つまり、ちゃんと入力しないとデータとして比較した際に同じであるべきものが違うと判断されたり、その逆が生じうる。

辻の一点、二点は教育すれば基準は理解できるだろう。同一視せよと言われればできない相談ではない。だが、この「楯」はどうか?区別せよと指導されたらできるものだろうか?

まあ、本当の問題はどこでしょうという話でした。




この記事が気に入ったらサポートをしてみませんか?