【統計ミス?】1984年、鹿児島県、合計特殊出生率「20.3」
都道府県別に合計特殊出生率の推移を示す動画を作成しました。
データの出所は、人口動態調査(厚生労働省)。政府統計の総合窓口であるe-Statからデータファイルをダウンロードしています。
対象となる年次
出生率に関するデータは人口動態調査内の項目「出生」で年次ごとに提供(目次リンク)。
「合計特殊出生率」は1988年以降の年次からデータファイルとして提供されるようになりました。が、ややこしいことに数値データ自体は1960年からのものが提供されています。
2020年2月時点では、下記要領で1983年から2018までの年次合計特殊出生率データを取得することができした。
- 1988年のPDF(1983, 1984, 1986)
- 1994年のCSV(1985, 1987-1994)
- 1997年のCSV(1995-1997)
- 2009年のCSV(1998-2009)
- 2018年のCSV(2010-2018)
上で書いた通り1960、そして1965、1970、1975、1980と5年ごとの年次データも提供されていますが間をつなぐデータがないため、年次推移を示すには不都合があります。
本当はばらばらのデータファイルとしてではなくデータベースにて、最古から最新のデータを一括ダウンロードできるようにしてほしいのですが、今回の本題はそちらではなく。
---
合計特殊出生率とは?
ここでまず、合計特殊出生率…とは何ぞや?というところから確認しておきましょう。
✔合計特殊出生率とは?
一人の女性が15歳から49歳までに産む子供の数を平均したもの。期間合計特殊出生率。
「一人の女性が15歳から49歳までに産む子供の数を平均したもの。」
こうした数値が「2.xを下回ると人口が減少する」などと人口推移の議論に用いられる有用なデータになります。人口は国・地域の根幹をなす重要なデータであり、現在時点でのよりよき政策決定を為すためには、未来の人口を正しく推定することが重要になります。
…という御託はさておき。
---
おかしなデータ
タイトルに示した通り、1984年の鹿児島県の合計特殊出生率がおかしなことになっています。
その数、実に「20.3」。
(左から2列目、下から2行目)
つまり、一人の女性が15歳から49歳までに産む子供の数を平均すると、20.3人。
そういうことを示すデータになっています。人類史上かつてないほどの高値であることは間違いないでしょう。
上で示した通り、1984年のデータは1988年のPDFファイルに記載されています。そして残念ながら、他年次のデータファイルには当該年次のデータが記載されていません。
1988年のPDFファイルが1984年の合計特殊出生率を示す唯一のデータファイルである、ということです。
このことによって、「20.3」という数値を外部から誤りであることを指摘できない状況が生まれてしまいました。せめてもう一つ、他年次でデータファイルが提供されていれば誤植か否か判断できたかもしれないものを…。
正誤判定
合計特殊出生率に関するデータはなくとも、他のデータから誤りの可能性が高いことを指摘できないか?というわけで1984年あたりの鹿児島県の「出生数」を見てみましょう。率がおかしい時、実人数もおかしいはず。
1987年のPDFファイルで確認します。
(鹿児島県は下から2行目)
1980: 24 540
1982: 24 662
1983: 24 374
1984: 24 202
1985: 23 375
1986: 20 902
1987: 22 486
なんら特異なデータではありません。
1986年の数値減少が合計特殊出生率の低下とリンクしているのとは対照的に、1984年の「20.3」という合計特殊出生率を支持するデータではありません。
ありうべき仮説としては、
「2.03」とすべきところ、「20.3」と打ち込んでしまった
という「タイプミス仮説」が有力に思われますが、そうすると当該年度、真上の宮崎県の合計特殊出生率がちょうど「2.03」となっていることに気付きます。
「2.03」と打ち込みたかったのか、それとも他の数値とすべきところ宮崎県のデータを誤って二重で入力するのに加えて小数点の位置を間違えたのか、疑惑は深まるばかり。
動画では
現状、何が正しいかを示すことが難しいため、「誤りは一つであった」という前提に立ち、「2.03」を1984年の鹿児島県の合計特殊出生率として利用し動画を作成しました。
ご参考まで。
この記事が気に入ったらサポートをしてみませんか?