はしごを外された!ならぬ、はしごをつけられても、もじもじしてられない文字要件


用語定義

  • MJ :文字情報基盤

  • MJ+:行政事務標準文字

  • +文字:行政事務標準文字のうちデジタル庁が標準化20業務で利用するものとして必要として追加したもの

経緯

総務省の住民記録標準仕様書で氏名等の文字セットが「MJ」と定義され、一律全業務がその定義を参照した。その後、データ要件・連携要件にて、氏名等の文字セットが「MJ」とされたものの、戸籍・戸籍附票が標準化業務へ追加となり、また共通要件及びデータ要件・連携要件等の検討会で氏名等の文字セット「MJ+」の検討が始まった。

文字要件検討会で現在検討継続中、2024.3に「MJ+」第1.0版が発出される計画であり、戸籍・戸籍附票システムは、無期限の経過措置、他の業務は、R5年度内に定められた期限で経過措置が取れることとなっている。

MJ+について2023.9に自治体に向けMJ+及びJISX 0213代替マップの仕様の一部が発出された。これは平成30年度法務省/戸籍文字整理事業に伴い、改製不適合戸籍(推定10,000件)を除く電算化済戸籍文字を包摂、グループ化し整理することで、+文字が9,198文字が選定されたものである。その後MJ+は行政事務標準文字として、デジタル庁告示(2023.7.7)、公開範囲は地方公共団体とされている。

昨年末2023.12.26に文字要件検討会第6回が開催され、1フォントでMJ+の運用を可能とする方針が発出された。当該フォントの発出時期は、令和6年度上半期予定とされている。

問題点及び課題

文字要件にかかる問題点、課題として、今まで各所であげられた内容について、標準化のみならず列挙してみようと思う。個別具体な運用によれば問題でもないものもあると考えられる。また、これらは個々人の見解である点、内容も整理しきれていない点は容赦いただきたい。

全般

標準化における文字要件確定時期が遅いことが1番の問題点と思われる。2026.3期限の標準化完了時期に対し、2024.3に「MJ+」第1.0版発出予定である。一方システムベンダは2023.3の業務仕様は標準仕様を原則的仕様凍結と認識し、業務システム等を改修もしくは開発中である。文字要件は細かな要件の一部でなく、システム開発上のベースラインとなる要件であるため、要件不確定に対するインパクトが大きい。また国の標準化事業としても、すでに移行支援期間内であるにも関わらず仕様が固まっていないことは問題であると考えられる。

①文字セットMJ+で使用可能な文字が1フォントに収録できず、アプリが2フォント制御必要

第6回検討会での発出情報を踏まえ、一旦は解消されたものの、以下の点が詳細化されることが必要である。

  • 使用が見込まれる文字とされる「基本フォントファイル」の選定基準と方法

  • 使用が見込まれなかった「予備文字ファイル」、「予備文字ファイル」にも含まれない文字のMJ+上での設定方法(MJ+外字?)

複数フォントにより使用・使用見込みなしの管理も行う必要がありあくまで経過措置的なものとなる。そもそもの問題であるOpenTypeフォントの65,536文字超えの仕様への変更について、(時間がかかるのは承知しているものの、規格を決める機関・OSメーカー等に国が申し入れするなどすることも必要ではないか。

②MJ、JISX 0213のIVS文字、合成文字の取り扱い、EUCへの影響

MJ+以前に、IVS文字、合成文字の取り扱いは、OAソフトでは癖があり、エンドユーザの作業工程で、字形が変わってしまう(基定文字に変わってしまう)可能性がある。

また複数フォントを制御する業務アプリケーションから出力されるEUCデータについては、+文字については、フォントを切り替える必要があり、例えば表計算ソフトから文書作成ソフトへの差し込み印刷時にも配慮が必要な可能性がある。(差し込み先の文書作成ソフトでは、氏名や住所等のフィールドは、1つのフォントで定義する必要がある。)
また、IVS文字、合成文字の入力は、エンドユーザでは容易にできない。
そして、MJ+対応した入力の補助機能(FEP)は、いつ開発されるか・・・。

③MJ+からJISX 0213への代替マップ不完全、代替不能時の定義なし

JISX0213の代替マップについて、MJ+全文字代替え可能なものを作るのが困難(不可能とも)であり、代替不可の定義がない。氏名等に使用されない根拠があればよいがその根拠はない。

④同一団体内マルチベンダの経過措置の調整

マルチベンダで、同一端末で複数ベンダのシステム稼働をする際、複数のMJあるいは、MJ+、EUDC(経過措置)などを設定する可能性があり煩雑、MJ+においてEUDCを活用するシステムと、現行文字セットの経過措置でEUDCを活用するシステムなどのケースもあり得る。
また、経過措置時に n(従来の文字セット):1(MJ+)マッピングすると元に戻せない懸念があり、これを団体別に対応する必要がある。

⑤マイナンバーカードの文字セットと不一致

マイナンバー収録時文字セット(JISX0208+JISX0212)はJISX 0213でなく、縮退を考えて元となる戸籍・住民票と不一致である。券面入力補助のための情報収録であるが、個人のアイデンティティを維持すると考えた場合どうなのか。シン・マイナンバーカードにおいても、その検討の形跡は見つけられなかった。

⑥ベースレジストリ「MJ+」は公開範囲が地方公共団体

ベースレジストリ「MJ+」は公開範囲が地方公共団体であり、データ連携する際は変換や縮退が必要である。国の行政機関はもとより、国民にも公開されない可能性がある状態である。

⑦異体字に関すること

住民記録の機能要件(機能ID:0010079)として、異体字検索があるが、文字情報基盤や縮退マップの情報では異体字に関する属性情報(+文字部分は現時点不明)が不十分であり、自治体間の機能差異が出るのではないか。

⑧アドレス・ベース・レジストリの文字セット

アドレス・ベース・レジストリは、基本データセットにおいる住所の町字IDとして活用されることから、現時点で試験運用版であること、また先に「住所がヤバい問題」も注目を浴びており、自治体システム側では、住所辞書は自由に選択できる中、アドレス・ベース・レジストリとの住所文字列突合による町字IDの導出も検討が必要だろう。2023.12.28に公開されたABRジオコーダーにかかる情報についても、確認が必要となると考えられる。

⑨同定補助金利用決定後の無償同定ツールリリース、同定基準

個人住民税特徴税通のために同定した後、無償の同定ツールがデジタル庁から発出。同定ツールは、参考であり全国一律の同定基準とするものでないこと。(同定基準が一律でないと、従来の字体は担保されない可能性があり、後述する本人確認等の問題が発生しうる)

⑩戸籍と住民票の字体不一致

戸籍は慎重に文字を整備するとして、自治体戸籍システムの原本は無限の経過措置であり、結果、戸籍と住民票の字体は乖離する懸念がある。結果、戸籍と、住民票の字体不一致(字形レベルかもしれない)が発生する懸念はないか。

現状の法的な側面を見てみると、住民票は戸籍の記載内容が正確にかつ字体を一致することとされている。(あくまで字体の一致。ただし正確に戸籍の記載内容を正確に記載するとある。)

これは、旧住民登録法が廃止され、住民基本台帳法が昭和41年に施行されるのとほぼ同時に、通知された住民基本台帳事務処理要領での定義であり、これに基づき地方自治体は、事務を行なってきた。この時点では、大多数の自治体では住民票・戸籍はコンピュータ化されていなかった。つまり、手書きにより戸籍・住民票の記載は、どれだけ頑張っても、記載内容は完全一致を求めるのは困難を極まる。

またコンピュータ化された今を以って戸籍の本籍地と住所地が違う国民については、それぞれの自治体において維持継続された戸籍・住民票のデータがデジタルデータで突合されることはなく、整合が保たれることはなかった。

今後、デジタル手続法による各種通知が住基ネット経由で流通されることとなることにより、戸籍と住民票の異動分文字データの整合は保たれることが期待される。しかし、もともと記載されていた文字が正しく記録されているかもわからず、後述するような本人確認上の問題は今後も起こりうる。

こういった経過、現状を以って、自治体システム標準化において、20業務以外はJISX0213でも良いとされるのはやや乱暴であると考える。住民基本台帳法第1条に「この法律は、市町村(特別区を含む。以下同じ。)において、住民の居住関係の公証、選挙人名簿の登録その他の住民に関する事務の処理の基礎とする」と冒頭からあり、住民に関する事務は20業務以外の事務においても、住民票のデータを持って事務の基礎とするため、氏名等の文字が違ってもよい理由はどこにもないのである。

⑪MJと+文字の文字整備時(国際化やMJのUCS変更など)・基本文字フォント、予備文字ファイルの運用方法が不明瞭

MJ-UCS変更、+文字からMJでの採用(UCS国際化時のMJーUCS変更)の場合の対処について、事前に決めておく必要があるのではないか。また、MJのみでUCS変更も予定されていると聞く。2023.12.26文字要件検討会(第6回)での基本文字フォントと予備文字ファイルについても、その運用方法が検討されているところであり情報開示が待たれる。

⑫文字追加見込み

河野デジタル大臣のブログ「文字コード」、デジタルでも日本文化を守るということは、登記文字や、官報文字も今後追加になる可能性がある。また、帰化外国人の氏については、戸籍統一文字に追加されることがある模様であり、文字追加にかかる今後の運用が明確にされることが必要と考えられる。

⑬本人確認問題と個人・家のアイデンティティ・運勢

氏名等の文字の字形が変わることなどを起因として、手続する際の複数資料間で字形相違が確認される場合、以下の問題が発生しうる。(今までも戸籍の電算化や住民記録システムの切り替え、JISX0208:1978から1983への変更時に少なからず起こってきたと想定。)

  • 銀行や金融機関、健康保険の手続で、本人確認書類と申請書類や他の添付書類の氏名等の文字が一致しないと、受理しないケースが今を以て存在する。(契約書類等はなおのこと)

  • 納税通知書等において、本人にそぐわない文字が表記されていた場合、「この納税通知書は俺に送られてきたものでない」と言い張り納税しない余地が出る。

  • (本人確認には直接関係ないが)字形がなんらか変わると氏名等の画数が変わる可能性があり、運勢が変わってしまう。

  • よく言われるところの本人あるいは「家」のアイデンティティの維持にかかること。(名付け親からの思い、そして本人の思い。XX家としての思い)

⑭住登外・法人での文字の扱い不明瞭

住登外氏名について氏名等に含まれていると考えられるが、そもそも、正しい文字で登録されてないケースがある。住民登録登外であっても、正しく登録するのが本懐であると考えるが、これまでの事務運用上、確認の術がなかったことも考えられる。標準化で氏名等をMJ+で格納することなどを機になんらか運用方法等整備されることがよいとは考えれられるが、これはこれで、従来と考えを変えるとこれまでの問題点の露見が気になるところ。

法人名は、登記文字で登記システム上管理されているが、法人番号公開サイトでは、JISX0213でのデータ公開となっていることから、JIS第4水準外の文字は、画像での公開。そもそも法人名は紙面での契約においても必要でありJISX 0213文字での契約を有効とする法整備が必要とも考えられないか。(文字の違いによる契約不成立などは聞いたことがないが。)

⑮国の文字セットがたくさんある問題とその適用範囲について

我が国には、文字セットがたくさんある。JISX0208、JISX 0212、JISX 0213、住基ネット統一文字、戸籍統一文字、登記統一文字、官報文字、入管文字、常用漢字、人名用漢字など。これらは、行政事務標準文字という定義の文字セットでは国全体でかかるコストを考えると統一されるべきと考えるが、行政事務標準文字の公開先がデジタル庁告示によれば、地方公共団体となっており、ただ20業務内で統一をしましたというだけに聞こえる。

少なくとも自治体の住民票のカーボンコピーである住基ネットにはMJ+を適用すべきとも考えられる。住基ネットの市町村間通知のみのMJ+の適用が検討されているようだが、住基ネット本体には適用されるという話が聞こえてこない。

⑯戸籍を含めたのに・・・。

標準化20業務に戸籍を含めたため、MJでは不足することと考え、戸籍の文字整備事業の情報を持って、MJ+が必要と考えたと理解している。ただし、戸籍のMJ+への移行には時間がかかるとして、無期限の経過措置となっている。一方戸籍以外の業務の経過措置は、令和5年度内にその期限を決めるとされている。何のためのMJ+なのか理解するのが難しい。前述の通り、戸籍と住民票は、文字の字体は一致すべきであるが、戸籍のみ字形の確保が必要とされることなのか。字形と字体との定義差は学術的には定義があっても、国民に広く理解いただくのはなかなか難しいと考えられる。また、今までも字形の差異を外字で吸収してきた歴史は、戸籍だけでなく住民票でもあり、標準化という理由だけで使用する文字を決めることは広く国民に理解をいただけるかどうか疑問も残る。文字要件検討会での広報・周知内容の検討にも期待したい。

⑰JISX0213も万能でない・・・・。

スマホ入力ではJISX0213より多くの文字が入力できる。利便性向上には、国民が使用できる文字セットに合わせていくことが必要と考えられる。JISX 0213が万能ということではない。いわゆるハシゴ高問題なども考慮が必要ではないか。

⑱IVS使いづらい問題

MJ+ならぬMJにおいても、IVS文字がある。表計算ソフトで文字数を確認する場合など、また、表計算ソフト付属のプログラムツールの文字列関数においても期待する値が返されないケースがある。表計算ソフトでツールを独自に作成することは、維持継続が難しくなるため避けたいところだが、自治体の業務運用において、費用対効果や事務運用の迅速性を考えるとEUC的なことは避けて通れない。その障壁を減らす手だては検討されてもよいとは考えられる。

⑲旧外国人登録者、住民票除票者データの取扱い

旧外国人登録者について、平成24年の外国人住民票開始により、文字セットが縮小整備された。住民票除票者については、除票保存期間が150年保存となり、一度登録された文字は少なくとも除票後150年間担保される必要がある。

これら現在現存データでは使用されていない文字が過去データでのみ文字データとして残存するものの取扱いについて(特に旧外国人登録でのみ利用のデータ)も明確にされるべきと考えられる。

⑳IPAmj明朝の半角文字等幅でない問題

IPAmj明朝については、半角文字の一部が等幅でない問題がある。MJ文字情報一覧には、非漢字の情報が収録されておらず属性情報がまずもってわかりづらい状態にあるが、一般社団法人文字情報技術促進協議会の文字ラボのページには、「IPAmj明朝フォント 非漢字情報一覧表」が掲載されている。その情報からすると例えば感嘆符を表す「!」は、Post nameがaj2、UCS実装は0x21と定義されていている。次のレコードを見ると、Post nameがaj232、UCS実装は空欄、備考欄に「aj2のHalfWidth」という定義が見つかる。つまりは、UCS実装されない半角文字がIPAmj明朝フォントには存在することがうかがえる。半角文字は等幅フォントで基本文字フォントに搭載することが望ましいと考えられる。

まとめ

第6回文字要件検討会で大きく進展はしているが、標準化の期限は変わっていない現状では、なかなか厳しい現状は変わらない。MJ+についてはいったん立ち止まり、現行通り、自治体内データ連携を含め既存文字セットの経過措置を戸籍以外の20業務についても無期限の経過措置を認めることも検討してもよいのではないか。

上記の通り多くのシステム的、運用上の問題点があると考えられる。国・地方含め、法制度の観点からも、自治体システムの標準化において拙速に事を進めるのでなく、一度立ち止まって現在と未来に有益な方法を考える必要があると考える。

この記事が気に入ったらサポートをしてみませんか?