見出し画像

自治体税務データ活用の課題と可能性:行政データと実証経済学⑧

経済セミナー編集部noteでは、『経済セミナー』2022年6・7月号から23年10・11月号まで8回にわたって連載した「行政データと実証経済学:東京大学CREPE自治体税務データ活用プロジェクトの実践」を、第1回から改めて掲載していきます。

第1回から第8回までの各回は、以下の noteマガジン に順次公開していきますので、ぜひご覧ください。

このnoteでは、2023年10・11月号に掲載された連載 第 8 回(最終回) をお送りします。



著者紹介

川口大司かわぐちだいじ
東京大学公共政策大学院教授/大学院経済学研究科教授

プロフィール
2002年、ミシガン州立大学Ph.D.(経済学)取得。2017年10月より東京大学政策評価研究教育センター(CREPE)副センター長、2019年4月から2022年3月まで同センター長を兼任。主著:『労働経済学』有斐閣、2017年。『日本の労働市場』(編者)、有斐閣、2017年。『計量経済学』(西山慶彦・新谷元嗣・奥井亮と共著)有斐閣、2019年。

正木祐輔まさきゆうすけ
神戸市デジタル監(DX担当局長)/東京大学政策評価研究教育センター招聘研究員

プロフィール
神戸市デジタル監(DX担当局長)/東京大学政策評価研究教育センター招聘研究員。2007年、東京大学法学部卒業。総務省自治行政局、内閣府地域主権戦略室、熊本県総務部、東京大学公共政策大学院准教授等を経て、2022年より現職。その間、2018年にハーバード大学大学院修士号取得。主著:「くまモンの『ロイヤリティフリー』戦略——成功の秘密は『くまモンの共有空間』にあった」(蒲島郁夫と共著)『中央公論』2014年4月号:124-132。「地方分権に関する経済理論とデジタル社会への示唆」『月刊地方自治』2021年9月号:22-48。

1. はじめに

東京大学政策評価研究教育センター(CREPE)は、複数の地方自治体と連携しつつ2021年夏に「EBPM推進のための自治体税務データ活用プロジェクト」を立ち上げた。本連載ではこれまで、プロジェクトの活動を紹介してきたが、連載の最終回となる今回は、この2年間(2021、22年度)の活動を改めて振り返り、今後の課題と展望を整理したい。

このプロジェクトでは、CREPEがプロジェクトに参加した自治体から匿名化された個人レベルおよび法人レベルの税務情報の提供を受け、 CREPEが行政改善のためのデータ分析を行って参加自治体にフィードバックするとともに、 CREPEでは提供されたデータを用いて学術研究に取り組んできた。

第1回(2022年6・7月号、川口大司・正木祐輔執筆)で述べたとおり、このプロジェクトには 3つの特徴がある。第1に、自治体とアカデミアの双方にとって実利がある形を目指しており、自治体との関係をあえて委託関係にしなかった。これにより、研究者が自治体の業務としてではなく、主体的に取り組む形で研究を行えるようにした。第2に、自治体の参入コストを下げる目的で、具体的な匿名化方法とその根拠、匿名化を実行するためのRのプログラムとマニュアル、個人情報保護制度の法的整理について、一般化した形で整備し、参加自治体に配付した。同時にCREPE側のコストも下げるため、分析プログラムはできる限りすべての自治体を共通のものとした。第3に、得られた知見はできる限り公表し、社会の共有財産とすることを目指した。本プロジェクトを実施するために行った個人情報保護制度の法的整理や規定類の整備、データ整理等といったさまざまな試みについて、成功と失敗の双方を含めて公表することで、今後同様のプロジェクトに取り組まれる際の参考としていただくことを目指した。今回は、この第3の目的を達成するためのものである。

2. 2023年度までの取り組み

2.1 参加自治体の概要

本プロジェクトへの自治体の参加募集は、基本的に公募として広く声をかける形で行った。2021 年度が明けたタイミングで2022年度の参加自治体を公募した。同時に、2021年度に参加してくれた、あるいは参加を検討してくれた自治体に対しては、個別に参加を促すように声をかけた。この際に、データ年、ハッシュ化された宛名番号、収入、所得といった税収予測や学術研究のために最低限必要な変数を提供していただけることを参加の条件とした。結果として、10の都道府県、25の市町村の合計35もの自治体の参加を得ることができた。

2.2 自治体によるデータ抽出と整形作業

参加自治体からは、CREPEに対して個人の識別情報を落として匿名化したデータを提供してもらった。そうするためには、税務システムからのデータの抽出、抽出したデータの正確性の確認、抽出したデータの匿名化加工、匿名化後のデータのCREPEへの送付については、参加自治体自身に行ってもらう必要があった。

第2回(2022年8・9月号、正木祐輔執筆)でも詳しく述べたように、このような手順をとって CREPEは直接、税務データに触れず、あくまでも匿名化されたデータを受け取るという形をとることにした。そのため、自治体の方々に対して、どのような変数をシステムから抽出してもらいたいか、抽出したデータが正しいかどうかをどのように確認してもらいたいか等を説明したマニュアルを作成した。具体的には、年度、宛名番号、控除前の収入金額、控除後の所得金額、控除の金額、所得合計、住民税額、個人属性等、およそ40変数を抽出していただくようにお願いした。また、抽出したデータを貼り付ければ記述統計量が計算されるエクセルシートを作成し、マニュアルとともに参加自治体に送付した。このマニュアルに沿ってデータを抽出し、配付したエクセルシートにデータを貼り付けると、記述統計量を含むデータの概要が出力される。そして、この概要を自治体からCREPEに送付してもらい、CREPEでデータが正しく抽出されているかを確認した。正しくデータが抽出されていることを確認した後、参加自治体はRを用いてデータを匿名化する作業へと移る。自治体ごとに同じ変数に付けられている変数名が異なるため、その対応関係を示す設定ファイルを自治体ごとに作成して、Rコードは共通のものを実行できるよう汎用化の努力をした。そのうえで、自治体にRならびにRStudioをインストールしてもらい、匿名化のコードを実行してもらうことで、匿名化が施されたデータを作成してもらった。匿名化の実行後には、コード実行の際に作成されたログファイルを送ってもらい、匿名化が成功しているかを確認した。そして最後に、匿名化されたデータをCREPEまでファイル転送システムを通じて送付、あるいは磁気媒体で郵送してもらうという手順をとった。

2.3 税収予測の作業

匿名化されたデータを受け取ったCREPEは、来年度の税収予測を行う。その詳細は第3回(2022年12月・23年1月号、深井太洋執筆)で報告されているので、ここではその概要のみを紹介しよう。市町村から受け取った世帯データは個人レベルで、都道府県から受け取った法人データは法人レベルでパネル化されている。このパネル構造を生かして、今年度の税額あるいは課税前収入を、前年度の同じ変数ならびに足元の経済状況を示すマクロ変数に回帰することで税収予測を行った。予測に当たって税額か課税前収入のどちらを用いるべきかは、自治体ごとにどの変数が入手可能かで異なるため、ケースバイケースで対応した。また、足元のマクロ経済変数をどこまで入れるかは、データへの当てはまりを見ながら選択した。そのため、1階の自己回帰モデルを基本としている点はすべての自治体に共通であるものの、推定に用いた変数は自治体によって若干異なっている。このように推定された、拡張された1階の自己回帰モデルを用いることで、今年度の収入あるいは税額から来年度の収入あるいは税額を予測し、収入を予測した場合には税率を掛けることで、各個人の税額を予測した。

自治体の税収を予測するに当たって、個人あるいは法人レベルの税額の予測値の他に大切な要素が、個人あるいは法人の消滅や新規参入である。個人レベルでは主に自治体間の移動で起こり、法人レベルでは移動に加えて退出や新規参入を通じても起こる。

退出に関しては、個人あるいは法人のレベルでの退出確率を、過去のデータに基づいて予測した。具体的には、前年の記録があるものの今年の記録がない場合は1をとり、前年も今年も記録がある場合は⚐をとる2値変数を定義して、前年の収入あるいは税額ならびにマクロ変数にロジット回帰した。この方法で各個人あるいは法人について退出確率を計算し、1から退出確率を引いて存続確率を計算し、存続確率を予測された税額に掛け合わせて得られた値を、各個人あるいは法人の税額の期待値とした。その一方で、自治体に新規参入する個人あるいは法人に関しては、前年の新規参入者の収入あるいは税額の分布をそのまま当てはめて、新規参入者の税額の予測を行った。これらの推定に基づき、継続個人・法人の期待税額ならびに新規参入個人・法人の税額を合計することで、自治体全体の税収を予測した。そして、このように得られた税収予測の結果を、その予測の方法に関する解説とともに報告書としてとりまとめ、参加自治体に送付した。

税収予測のうち、市町村向けの世帯を対象とした個人住民税の税収予測は比較的高い精度で行うことができたものの、都道府県向けの法人を対象とした地方法人二税(法人住民税、法人事業税)の税収予測では高い精度を出すことができなかった。その理由として、個人の収入に比べて法人の収入のブレが大きいという根本的な理由が挙げられる。それに加えて、法人の場合は次の年に修正申告等が相当な頻度で行われているため、ある法人のある年の収入が複数年に記録される。このような理由から、特定の年の所得を確定することが難しいという、技術的な課題があることも明らかになった。また、自治体の担当者も同様に後者の法人関係税収に関する問題に直面しているということが判明した。

税収予測は自治体からの需要がある分野であり、このプロジェクトを続けていくうえでも重要なテーマだと考えている。しかし、現在の方法は集計量の予測であるため、CREPEが提供を受けているパネル構造のミクロデータとしての強みを必ずしも生かし切れていないという側面もある。ミクロデータの特性を十分に生かすことができ、かつ多くの自治体にとって有用な情報が何かを探っていくことは、今後の課題である。

2.4 記述統計量の作成作業

プロジェクトでは、受け取ったミクロデータの基礎的な集計結果も、自治体に送付した報告書に含めて提供している。具体的には、世帯を対象とした市町村向けの集計の場合、住民税の平均値や中央値に加えて、それらの時系列的な推移や年齢・性別ごとの平均値等を報告した。また、所得なしも含めた所得階層別の世帯構成が時系列とともにどのように変化しているかについても報告し、自治体内の所得分布が年を経てどのように変化しているかが把握できる図も提供した。

また、転入と転出に関しては、どのような年齢層、ならびに課税額の人々が転入・転出しているかについても、年ごとに計算し時系列的な推移が把握できる図を提供した。これらの図表は、税務データの基本的な属性の特徴と推移を伝えるものであり、足元でどのような変化が起きているかを把握するのに役立つ資料になったと考えている。また、所得額の所得項目ごとの内訳を見ると、給与収入が最も大きな項目となっている一方で、公的年金収入が相当大きな所得項目となっている自治体も散見され、年金政策の変更が地域の所得に与える影響は無視できないことも見て取れる。都道府県に向けて送付した法人関係税関連の報告書の中では、確定申告を行う法人数の時系列、事業所得に応じて課税される事業税を納めない法人の比率の時系列を資本金階級別に報告した。参加してくれた10の都道府県の報告書を見ると、これらの時系列は比較的安定して推移している。これはよく知られたことではあるものの、事業税を納めない法人数は、どこの自治体でも過半数となっている。このことは、法人関係税の減税を通じて企業行動を誘導しようとする政策が、実は過半数の法人には影響を及ぼさないことを意味しており、その政策効果を論じる際に意識すべき法人の異質性があることを示唆しているともいえる。

世帯関連にせよ法人関係にせよ、記述統計量の要約は参加自治体に足元の経済状況を知らせる基礎資料を提供するだけでなく、政策効果に関する学術研究を行ううえで重要な気付きを与えてくれるものとなっており、今後の学術研究にもつながりうる発見があった。なお、法人データを用いた分析例とさらなる研究の可能性については、第7 回(2023年8・9月号、鈴木崇文執筆)で中小企業による租税回避のための課税所得調整、すなわち集群(bunching)行動の分析例が紹介されている。

2.5 学術研究の初期的成果

第1回でも述べたように、本プロジェクトの目的は、参加自治体に税収予測や記述統計を含む報告書を送付することでEBPM推進の支援を行うことと、学術研究の発展に寄与することの2つである。われわれが取り組んでいる学術研究も、まだ初期的な段階ではあるものの着実に進んでいる。ここでは、これまでに本連載でも解説した結果を改めて簡潔に紹介したい。

第4回(2023年2・3月号、近藤絢子執筆)では、ミクロ実証経済学的なアプローチをとった研究を紹介した。配偶者控除や第三号被保険者の制度といった一定の所得以下の被扶養者を優遇する税・社会保障の制度が、主として既婚女性の労働供給を抑制している、という指摘がしばしばなされている。「女性版骨太の方針2023」でも「女性の視点も踏まえた社会保障制度・税制等について検討を行う」とされている [1]。今後の政策を考えるうえで重要なのは、従来から今日に至る税・社会保障制度がどの程度、既婚女性の就業を抑制し、さらにはこれまでの制度変更によって彼女たちが就業行動をどのように変化させてきたかを実証的に明らかにすることである。税・社会保障制度が既婚女性の就業行動に影響を与えるという仮説を検証した経済学の論文は数多く存在しており、これらが現在の政策論議に大きな影響を与えていることは間違いない。しかしながら、クロスセクションのデータで労働供給行動の変化を見ることができなかったり、サンプルサイズが限定的で政策の影響を正確に推定できなかったりといった欠点があったのも事実である。このプロジェクトで整備している市町村から得られる個人・世帯レベルのデータは、世帯構成がわかるうえに給与収入が正確にわかるパネルデータとなっている。さらに、サンプルサイズが数百万にも及ぶ大規模データである。第4回ですでに一部紹介されているように、既婚女性の給与収入は税・社会保障制度が作り出す、いわゆる「壁」の部分に集積していることが明らかになっている。加えて、その分布が独身女性のものとは異なっていることも明らかになっている。この良質なデータを用いた実証研究は、今後の政策論議の解像度をさらに上げていくことに貢献できるだろう。

[1]内閣府男女共同参画局「女性活躍・男女共同参画の重点方針2023(女性版骨太の方針2023)」(https://www.gender.go.jp/policy/sokushin/sokushin.html)。

第5回(2023年6・7月号、北尾早霧・鈴木通雄・山田知明執筆)では、マクロ経済学者による研究を紹介した。マクロ経済学者が関心を持つ消費・貯蓄行動を説明する際に重要な要因は、個人が直面する所得リスクの大きさである。特に、将来の所得が現在の所得に比べてどの程度変化するかは、個人が直面するリスクの大きさを評価するうえで重要である。また、極めて大きな所得の変動がどの程度の頻度で発生するかも、個人や世帯の消費・貯蓄行動を決定するうえで重要な要因である。このように、個人や世帯が経験する所得の変動を時間を通じて追跡し、その特性をいくつかのパラメータで記述することを、「所得プロセスを推定する」というが、正確に所得プロセスを推定するためには、個々人の各時点の所得を正確に捕捉した大規模なパネルデータが不可欠である。われわれのプロジェクトにおいて市町村から収集されている個人レベルのデータは、こうした条件を満たす質を備えている。第5回では、このデータに基づいて前年の給与収入から今年の給与収入がどの程度変化したかに関する年齢等の属性に応じた分布が計算されている。これによって、各個人が直面する所得リスクについて学ぶことができる。また、各個人が経験する所得ショックがどの程度永続的かということも、所得リスクの大きさを検証するために重要になる。たとえば、失職による所得低下というショックが、再就職によって数カ月のうちに回復するのであれば、ショックの大きさは限定的だといえる。しかし、所得低下が数年間にもわたるようであれば、ショックは大きいといえる。このように今年の所得変動要因が来年にどのように持ち越されるかを知ることは重要だが、この永続性の大きさは、自己回帰モデルを推定することで記述するのが一般的である。これらの実証分析から得られた所得プロセスに関するパラメータは、マクロモデルを用いたシミュレーションを行ううえで重要な情報となると考えられる。

最後に、第6回(2023年8・9月号、亀山裕貴・川口大司執筆)で解説した給与収入の時系列変化に関する研究を紹介しよう。昨今、日本経済全体を見渡したときに最も大きな経済問題だと認識されるようになった現象として、「賃金停滞」が挙げられる。名目賃金が上昇せず、そのことが物価水準の停滞を招き、マクロ経済全体の悪循環をもたらしている、といった主張が盛んになされるようになった。もっとも、このような主張がなされる際に参照されている名目賃金の時系列は、厚生労働省の「毎月勤労統計調査」や「賃金構造基本統計調査」の調査時点ごとの平均賃金を計算し、時系列でつなぎ合わせたものであることが多い。このような計算方法の場合、調査時点ごとに雇用者の構成が変化していた場合には、そのことも平均賃金を変化させる要因となる。近年の日本では、雇用者に占める30・40歳代の女性の構成比率が上昇している一方、彼女たちの賃金水準は低いため、名目賃金の平均値の伸びを停滞させる要因となっている。

労働者の構成が変化することによって平均賃金の時系列が影響を受けることは「構成バイアス」と称され、賃金インフレや賃金デフレの大きさを調べる際の阻害要因となることが、既存の研究で広く知られている。この構成バイアスの問題を乗り越えるための標準的な方法は、パネルデータを用いて各個人の賃金変化を追跡することである。日本には慶應義塾大学、大阪大学、リクルート、厚生労働省等が作成するパネルデータがあり、さまざまな研究目的に使用されてきた。しかし、これらはアンケート調査であるためサンプルサイズが限定的だという限界もある。この限界を乗り越え、構成バイアスを除去しつつ賃金インフレを推定しようとした研究を紹介したのが第6回である。大きな人口を抱える政令指定都市と人口規模の小さな市のデータを用いた研究を行ったが、政令指定都市のデータを用いた研究からは構成バイアスを除去せずに賃金インフレを計測しようとすると下方バイアスがかかることが明らかになった。より具体的には、この市における2015年から2020年にかけての給与収入成長率は、通常の方法で計算すると7.07%であったものの、構成バイアスを除去すると8.37%となり、通常の計算方法による結果には下方バイアスがかかっていることが明らかになった。これは、2015年から2020年にかけて、給与収入が低いタイプの労働者の労働参加が増加したことを示唆している。

3. 2023年度の作業

3.1 新たな法的論点の検討

本プロジェクトは、当初から、経済学者のみならず法学者・情報工学者も参画しており、自治体税務データの利活用に当たっての法的論点に正面から取り組んできた。法的論点の中で、2023年度のプロジェクトから新たに検討を要することになったのは、個人情報に関する法的規律の一元化に伴うものである。

2023年4月1日に「デジタル社会の形成を図るための関係法律の整備に関する法律」(令和3年法律第37号)第51条に関する部分が施行され、自治体における個人情報保護については、これまでのように自治体ごとの個人情報保護条例で規律されるのではなく、国の個人情報保護法が自治体にも直接適用されることとなった。

そこで問題となるのは、自治体からCREPEに税務データを提供するに当たって、自治体に、当該データを法律上の「個人情報」として扱ってもらうか、「行政機関等匿名加工情報」として扱ってもらうか、という点である。

民間企業の扱う情報は、「個人情報」、「仮名加工情報」、「匿名加工情報」の大きく3種類に分けられ、「仮名加工情報」は、「他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工して得られる個人に関する情報」(個人情報保護法第2条第5項)、「匿名加工情報」は、「特定の個人を識別することができないように個人情報を加工して得られる個人に関する情報であって、当該個人情報を復元することができないようにしたもの」(同条第6項)とされる。一方、自治体については、適用除外となっているため(同法第16条)、この3分類ではなく、「個人情報」と「行政機関等匿名加工情報」(同法第60条第3項)の2種類となっている。

本プロジェクトでは、自治体の税務データは何らかの匿名化を施されたうえでCREPEに提供される。氏名や住所の削除、宛名番号のハッシュ化等はいずれの場合にも行われるが、トップコーディング、3-匿名性を満たす秘匿化等の加工を施すことにより、匿名加工情報制度において求められる水準の匿名加工を行う「高度な匿名化」と、それに満たない程度の加工を行う「簡易な匿名化」および「中間的な匿名化」を用意している。

「簡易な匿名化」および「中間的な匿名化」を行った税務データについては、個人情報保護法上の「個人情報」として扱わざるをえないが、「高度な匿名化」を行った税務データについては「行政機関等匿名加工情報」として扱うことが可能な場合もある。

「行政機関等匿名加工情報」として扱うことのできる情報については、「行政機関等匿名加工情報」として扱ってその法的規律に服するか、「個人情報」として扱ってその法的規律に服するかは、法律上は各自治体の任意に委ねられている。両者を比較すると、「行政機関等匿名加工情報」として提供いただく場合には、自治体の個人情報ファイル簿への記載、行政機関等匿名加工情報の利用に対する提案、審査、契約の締結といった手続が発生し、自治体・CREPE双方にとって煩雑なプロセスになってしまう。そのため、本プロジェクトにおいては、「行政機関等匿名加工情報」として扱える水準の「高度な匿名化」を行った税務データについても、個人情報保護法上の「個人情報」として扱い、「個人情報」としての法的規律に従って、CREPEに提供いただくこととした。

なお、「個人情報」として扱った場合も、本プロジェクトは「学術研究の目的のために保有個人情報を提供するとき」(個人情報保護法第69条第 2項第4号)と評価できるため、同条に基づく外部提供として個人情報保護法上許容される。

あわせて、本誌2022年6・7月号でも特集が組まれた「経済学と再現性問題」の議論もふまえた見直しも行った。学術論文の査読プロセスにおいては、研究成果を発表する学術雑誌から、データから論文で示されている研究結果が導けることを確認する目的(再現性目的)で、データの提供を求められることがある。近時、さまざまな学術的問題を背景として、再現性目的でデータを提供しない限りは論文の投稿を受け付けない、あるいは掲載まで至らない雑誌が急増している。そのため、本プロジェクトの研究成果を論文として適切な媒体で公表するためには、再現性目的に限定して、学術雑誌に対してデータを提供できるようにすることが必要不可欠である。そこで、CREPEが定める「自治体税務データ活用プロジェクトにおけるデータ取扱規則」[2] を改正し、CREPEセンター長がデータ提供先や提供先における守秘義務・情報管理体制を確認したうえで、再現性目的に必要な限りで、自治体から提供いただいたデータを学術雑誌側に提供できる旨を明記するとともに、自治体募集の段階で、そうした必要性を自治体にも説明し、それもふまえて応募いただくこととした。

[2]「自治体税務データ活用プロジェクトにおけるデータ取扱規則」等の資料は、「文部科学省科学研究費補助金学術変革領域研究(B):税務データを中心とする自治体業務データの学術利用基盤整備と経済分析への活用」のウェブサイト内、「自治体の方へ」のページで公開している。

本プロジェクトは、当初から、自治体を巻き込む以上、法的論点にも遺漏がないようにとの考えで法的整理を行ってきた。プロジェクトを進めるにつれて明らかになったのは、法的論点は、単なる経済学的分析の制約条件ということではなく、「技術の発展に伴って発生する個人情報保護とデータ利活用という2つの要請の間でどう適切にバランスを取っていくべきか」という、むしろそれ自体が学術的な研究の価値のある論点であるということであった。本プロジェクトは、そうしたテーマでの法学研究のフロンティアになりうる。

そこで、宍戸常寿教授(東京大学大学院法学政治学研究科)、小川亮助教(東京都立大学法学部)をはじめとする10名程度の法学者を中心とする法学班を組織した。法学班における検討では、既存の法令や判例から何がいえるかを明らかにするのみならず、新たな時代の要請に応える法解釈論の提示や、法令改正の提言をも行うことを視野に入れている。

その中では、たとえば、匿名化を行わずに税務データを外部(CREPE)に提供した場合、地方税法第22条の「秘密漏えい」に当たるのか、といった論点についても検討することとしている。本プロジェクトにおいては、第2回で述べたように、

「自治体がCREPEに提供するデータは、少なくとも、匿名化がなされているものであり、秘密たりえない状況にあると解釈できるのであれば、地方税法第22条の構成要件を満たさず、したがって、同条が規定するところの秘密漏えいたりえない」と整理しているが、これにとどまらず、匿名化がなされておらず、「秘密」に当たったとしても、自治体の意思としての本プロジェクトへのデータ提供は「漏えい」に当たらないのではないか、といった論点についても議論を始めたところである。

3.2 実施体制の整備

参加自治体から匿名データの提供を受け、分析結果を返すためには、多くの自治体とのやりとりや、Rのコード作成が必要になる。そのため、このプロジェクトでは多くのリサーチアシスタントを雇用し、学術専門職員が中心になってマネジメントに当たっている。多くの方々の献身的な努力なくしては、プロジェクトを進めることはまったくできなかった。

作業を効率的に進めるため、このプロジェクトでは実務を執り行うメンバーを2つの大きなチームに分けている。自治体とのコミュニケーションを行う「自治体チーム」と、主にRのコードを取り扱う「Rチーム」である。複数の自治体とのコミュニケーションは、そのマネジメントが難しいが、この分業体制をとることで、各自治体とのコミュニケーションの窓口が一本化されるというメリットがあった。また、Rチームは基本的にRのコードを書くことが仕事の主体となるものの、自治体への問い合わせを行いながら作業を進めなければならない場面も多い。しかし、その際には自治体チーム経由で問い合わせをすることにしており、Rチームの構成員が自治体とのコミュニケーションを行うためのコストが低くなるように工夫している。

自治体チームにはリーダーとサブリーダーが1 名ずつおり、Rチームには業務内容に応じてリーダーが2名いる。彼らは、メンバーの仕事量やスキルに目を配りつつ、仕事の配分や進ḿ管理を行っている。さらに、プロジェクトを行うためには、これら複数のチームを統括し、全体の進行を管理したり、データの管理が適切に行われているかを定期的に点検したりといった業務もある。これについては、統括補佐が目を配っている。さらに研究費の執行等に関しては秘書がおり、文書管理等に関してはCREPEの職員が担当している。

今回のプロジェクトは「文部科学省科学研究費補助金 学術変革領域研究(B):税務データを中心とする自治体業務データの学術利用基盤整備と経済分析への活用」によって支えられているが、この研究代表者が東京大学社会科学研究所の近藤絢子教授である。本稿の筆者の1人である正木は現在神戸市の幹部職員であるが、CREPEの招聘研究員を務めていて、プロジェクトの創始者として顧問の立場でプロジェクトに参加している。もう1人の筆者である川口は上述の科研費において組織されている学術利用基盤整備班の班長という立場である。この3名によって、基盤的な業務を統括している。

本プロジェクトには自治体への報告書提供という業務が含まれており、通常の研究プロジェクトとは根幹において異なる部分がある。このマネジメントは通常の研究プロジェクトのマネジメントとは相当異なっており、大人数のチームを階層的に管理する必要がある。これまでに行政機関、民間企業、NGOでマネジメント業務を担当した経験者がこのプロジェクトにはさまざまな立場で参加しており、彼・彼女らのスキルがこのプロジェクトの継続のためには不可欠なものとなっている。

4. 今後の展開:データ標準化をふまえて

現在、デジタル庁・総務省の旗振りのもと、地方公共団体情報システムの標準化に関する法律に基づき、2025年度を目標に自治体情報システムの標準化・共通化が進められている。これにより、自治体やシステムベンダごとにバラバラだった自治体税務システムのデータレイアウト(データ項目名、型、桁数等の属性を定義したもの)についても、デジタル庁・総務省が定めるデータ要件の標準に定めるとおり、必要に応じて、任意のタイミングで出力することができるようになる。

本プロジェクトでは、第2回で述べたように、 1自治体当たりのCREPE側の人的・財政的なコストをできる限り小さくするよう、メタプログラミングの手法を活用して、共通の匿名化・分析プログラムをすべての自治体に適用している。2.1 項で紹介したとおり、2022年度は、本プロジェクトに35もの自治体に参加してもらった。この工夫がなければ、到底プロジェクトを回すことはできなかった。

こうした工夫により、税収予測・分析そのものについては自治体ごとの負担を小さくすることができたが、税収予測・分析プログラムを回す前の自治体ごとのデータクリーニングや、共通のプログラムを回すために自治体ごとに設定する必要のあるパラメータの把握については、それなりの負担があった。自治体情報システムの標準化・共通化が実現すれば、こうした負担も大きく減ることが予想される。

自治体やシステムベンダの声を聴く限り、2025 年度に全自治体の全システムが一斉に標準準拠システムに移行することは容易ではなさそうだが、この目標どおりに移行できる自治体・システムもそれなりにあると期待される。自治体情報システムの標準化が、本プロジェクトのみならず、自治体間比較を行うような分析も含めて、EBPMの推進に資することを期待したい。

5. おわりに

本稿では、2021年夏より始まったCREPEの自治体税務データ活用プロジェクトの2年間を振り返り、8回にわたる連載の結びとした。

本プロジェクトの特徴は、通常の研究プロジェクトとは異なり、プロジェクトを管理する実務的な業務が多いことである。このようなプロジェクトは、国あるいは地方自治体の事業として行ったほうがよいのではないかとも考えられるが、どのようなデータやデータ利用環境が望ましいのかを直接知り、それをデータの整備やデータ利用環境のルール整備を行う中で生かすことができるということは、データユーザーである経済学者の立場からは、大きなメリットである。また、データの価値と個人情報保護との間のトレードオフに関する論点は、法学者の中でも議論すべき点が山積していることが明らかになり、このプロジェクトをユースケースとして法学的観点から見て最先端の学術的議論が行えるということも明らかになった。分野は離れるが、大型の実験施設を用いる自然科学の大型プロジェクトも、研究機関がその事業を主導しているわけであり、社会科学のデータ整備に関してもそのような側面があるのかもしれない。そのような観点から見ると、このプロジェクトを大学の中で継続していくことには一定の意義があるといえそうだ。

その一方で、大学における社会科学系の部局組織は、多くの自然科学分野における講座制のように、チームで働くような組織形態は整っていない。そのため、チームビルディングは産みの苦しみを伴うものであり、現在プロジェクトが円滑に進められているのは、多くの方の献身的な努力のたまものである。もっとも、学生のリサーチアシスタントを中心にメンバーが順次入れ替わっていく組織において、オペレーションを永続的なものとするためには、やはり組織運営に習熟した人材が必要であり、これは従来型の経済学の研究者に求められる資質とは必ずしも重ならない。その意味では、行政機関や民間企業での組織運営の経験を持った人材を確保することが、来年度以降も安定的にこのプロジェクトを継続していくための課題である。


「自治体税務データ活用プロジェクト」の最新情報については、以下の文部科学省科学研究費補助金学術変革領域研究 (B)「税務データを中心とする自治体業務データの学術利用基盤整備と経済分析への活用」のウェブサイトをご覧ください!

https://web.iss.u-tokyo.ac.jp/jichitai_data/

*本稿は、『経済セミナー』2023年10・11月号からの転載です。


サポートに限らず、どんなリアクションでも大変ありがたく思います。リクエスト等々もぜひお送りいただけたら幸いです。本誌とあわあせて、今後もコンテンツ充実に努めて参りますので、どうぞよろしくお願い申し上げます。