![見出し画像](https://assets.st-note.com/production/uploads/images/107262520/rectangle_large_type_2_d721bf63bfac2d4defb048553b2a308e.png?width=800)
再び住所問題について
河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件
— 杉原航太 (@kota_sugihara) June 4, 2023
河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… pic.twitter.com/aF2jzwtBkN
河野大臣のこんな発言を受けて
・表記ゆれの補正はAIにやらせるまでもない
という程度の意見が多く寄せられている。しかし「住所照会」で考えた場合、これはそう単純な問題ではないのだ。現行のシステムでは住所はカンマで区切られた一つの文字列で照会にかけられる。
つまりここに批判的なコメントを掻きこんでいる人々の所属する組織が住所を市区町村、町名、番地以下の三つのセパレートで保管しているとすれば、そのデータベースをそっくり取り換えてから文句を言うべきなのだ。
![](https://assets.st-note.com/img/1685924388068-z9q6jVMlQ6.png)
例)御殿場
国土交通省土地総合情報システム Gotenba
国土地理院Gazetteer of Japan 2007 Gotenba
総務省国勢調査(地域一覧) Gotemba
市役所Webページ Gotemba
警察署 Gotenba
駅 Gotemba
インターチェンジ Gotenba
河野大臣の表記ゆれ発言は、そもそも住所に正規表現がなく、現時点では内閣官房IT戦略室から引き継いだ住所の標準ガイドラインは存在するものの、自治体が有している住所は届け出制であり、当然各企業や健康保険組合が持っている住所もばらばらの表現になっているので、csvでの照合が難しいのですよという話だ。
ここまではそうおかしな話ではない。
では自称プログラマーの皆さんがどこかの自治体の住所管理を担当したとして、標準ガイドラインに合わせて住所を一括変更できますか、というと恐らく無理であろう。住民票は転入届を以て一件ずつ登録する仕組みなので、そもそも全体の住所を一括で変更する仕組みはない筈。システムベンダーがやってやれなくはないとしても権限的にできないのではなかろうか。住所表記を変更すると恐らく記録上一度引っ越した形になるはずだ。
つまりもし表記ゆれを前提に住所照会を成立させるには、大元にあるデータベースを直接いじるのではなく、中間領域に照会用データベースを作るか、またはcsvデータの照合ではない別の方法を考えるべきであろう。
ジオコーディング(住所表記の揺らぎを判断しつつ正確な場所を特定すること)って物凄く難しくて、Googleが大金をつぎ込んで開発しているGoogle Maps Platformですら「それなりの割合で」外すんですよね。
— にゃんこそば🌤データ可視化 (@ShinagawaJP) June 5, 2023
マイナンバーが絡むと色眼鏡がかかるんだろうけど・・・住所照合、ほんと沼ですよ。 https://t.co/0d8QFHryfk
システムを触ったことのある人なら秒でわかるはず、住所の表記揺れはすぐ解決できる問題ではないことに。全角と半角、漢数字と数字、丁目の有無な空白など、フリーフォーマットな記載から一意にするのは気の遠くなるような処理が必要なはず。 https://t.co/k6x3xa4YHt
— うめめ🔛ITエンジニンジン🐰 (@beConjuror) June 5, 2023
そういう前提では河野大臣の「AI」発言はそう頓珍漢なものではない。
人間はシステムの中に入ってデータベースの中を覗くことは出来ない仕組みだ。照会記録はログで残る。この照会システムをどういじればあいまい検索ができるのかは私には解らない。ただ「テキスト変換なんか簡単だ」という話ではないのだということだけが解る。
我が名はシッタカ!
— 🍋ふわてゃんは毎日☆飲酒運転🍺🍥 (@ikegpg) June 6, 2023
住所の表記揺れをExcelでええやんとつぶやいたら自称エンジニア達にフルボッコにされた!悔しいから2時間で作れると言ってしまった!Excelとは何か!!!!! pic.twitter.com/N9NmAjARbJ
住所の正規化がいかに大変かというのが盛り上がっててGISエンジニアとしては嬉しい限り。
— Hal Seki (@hal_sk@fosstodon.org)🛡️ (@hal_sk) June 6, 2023
この分野はみなさんが言うように本当に沼で、以前 Geolonia さんが鼻血出してました。https://t.co/s54k3yaK9Y
AI 活用できないか?というのも、真面目にやってるところが既にありますね。
廃墟となった村の壁に書き残された出師表。ふと、耳なし芳一の怪談が頭をよぎる。 pic.twitter.com/QVFkEF5l0C
— 阿明 (@KURAMOTOTOMOAKI) June 5, 2023
この問題、今「住所の正規化」で検索するとおっぱいの大きな人の画像が出て來るほどやばい。堺は「丁目」ではなくて「丁」ですよというくらいやばい。しかし闇はもっとある。まだ技術的な問題が論じられているに過ぎない。住所とは配達先なのか、納税場所、管轄区分なのか、居住地なのか、実家なのかという定義があいまいだ。それぞれが別な人の場合、どれを登録するのか?
北方領土の郵便番号はどうなるのか?
それにしても子供の頃教わった大切なことを見な忘れてはいないだろうか。「馬鹿というやつが馬鹿だ」、このテーゼは永遠に不滅だ。調べて、考える。それが出来ないで脊髄反応みたいに誰かの悪口を書きこむ人は、多分脳の血の流れが滞っている。風呂に入るなり酒を飲むなりして、淤血を流した方がいい。
この記事が気に入ったらサポートをしてみませんか?