再び住所問題について
河野大臣のこんな発言を受けて
・表記ゆれの補正はAIにやらせるまでもない
という程度の意見が多く寄せられている。しかし「住所照会」で考えた場合、これはそう単純な問題ではないのだ。現行のシステムでは住所はカンマで区切られた一つの文字列で照会にかけられる。
つまりここに批判的なコメントを掻きこんでいる人々の所属する組織が住所を市区町村、町名、番地以下の三つのセパレートで保管しているとすれば、そのデータベースをそっくり取り換えてから文句を言うべきなのだ。
河野大臣の表記ゆれ発言は、そもそも住所に正規表現がなく、現時点では内閣官房IT戦略室から引き継いだ住所の標準ガイドラインは存在するものの、自治体が有している住所は届け出制であり、当然各企業や健康保険組合が持っている住所もばらばらの表現になっているので、csvでの照合が難しいのですよという話だ。
ここまではそうおかしな話ではない。
では自称プログラマーの皆さんがどこかの自治体の住所管理を担当したとして、標準ガイドラインに合わせて住所を一括変更できますか、というと恐らく無理であろう。住民票は転入届を以て一件ずつ登録する仕組みなので、そもそも全体の住所を一括で変更する仕組みはない筈。システムベンダーがやってやれなくはないとしても権限的にできないのではなかろうか。住所表記を変更すると恐らく記録上一度引っ越した形になるはずだ。
つまりもし表記ゆれを前提に住所照会を成立させるには、大元にあるデータベースを直接いじるのではなく、中間領域に照会用データベースを作るか、またはcsvデータの照合ではない別の方法を考えるべきであろう。
そういう前提では河野大臣の「AI」発言はそう頓珍漢なものではない。
人間はシステムの中に入ってデータベースの中を覗くことは出来ない仕組みだ。照会記録はログで残る。この照会システムをどういじればあいまい検索ができるのかは私には解らない。ただ「テキスト変換なんか簡単だ」という話ではないのだということだけが解る。
この問題、今「住所の正規化」で検索するとおっぱいの大きな人の画像が出て來るほどやばい。堺は「丁目」ではなくて「丁」ですよというくらいやばい。しかし闇はもっとある。まだ技術的な問題が論じられているに過ぎない。住所とは配達先なのか、納税場所、管轄区分なのか、居住地なのか、実家なのかという定義があいまいだ。それぞれが別な人の場合、どれを登録するのか?
北方領土の郵便番号はどうなるのか?
それにしても子供の頃教わった大切なことを見な忘れてはいないだろうか。「馬鹿というやつが馬鹿だ」、このテーゼは永遠に不滅だ。調べて、考える。それが出来ないで脊髄反応みたいに誰かの悪口を書きこむ人は、多分脳の血の流れが滞っている。風呂に入るなり酒を飲むなりして、淤血を流した方がいい。
この記事が気に入ったらサポートをしてみませんか?