【JKI】007_Women_in_ Government_02_視覚化への考察
【JKI_007挑戦中】課題残件を確認
Just KNIME It! (JKI)
より
2までは解答内容を紹介してきました。
【新たな指標の提案】
「地方自治体の女性が保有する議席の割合」データは空白値が多いため、各自の工夫で目的に合った情報を得るためデータ拡張することを求められています。
私は地方自治体の代わりに国会における同様のデータを参考値として別カラムとして加える手法を採用しました。
ではその後大陸もしくは地域別にデータを集計する場合にどうするか。
国会のデータに関しては空白値は少ないのですが、だからといって国会データだけで集計してしまっては課題のデモデータの情報を利用していないことになります。
そこで今回は下記の計算値「(平均)議席占有率」を視覚化などで用いる指標に提案します。
(平均)議席占有率:
地方自治体と国会それぞれにおける女性の議席占有率の相加平均とする。
ただしどちらか一方のデータが欠損している場合はデータがある方の議席占有率をそのまま用いる。
今回は地方自治体データのみがある国はありませんでした。よって条件分岐は地方自治体データの有無の2つのみとなります。
KNIMEでは下図のWFで算出しました。視覚化のための数値の丸め込み処理も行っています。
結果:
今回このような新指標を提案した理由の一つには、地方自治体データが示されていない国に、米国、中国、ロシアと世界情勢を考えるに注目せざるを得ない国々も含まれていたことがあります。世界に平和もしくは危機をもたらす国々であることは今まさに皆さんも実感されていることと思います。
これらの国々のデータなしで地域別の集計をしてその地域の特性を調査できるものだろうかと考え、新指標を今後の解析に用いることとします。
【視覚化のためのデータ前処理】
視覚化の前に必要なデータをそろえ、行列を整列したのが上記WFです。
最も重要なパートであるGroupByノードの設定を以下に示します。
技術面はまたもまっきーさんの記事を紹介するに留めます。
設定:
Column Renameで表示名を整えたのちの結果を以下に。
地域別の(平均)議席占有率以外にもLDC数などの数値を算出しました。
その地域の特徴を知るための参考になればと考えました。実際これらの値の分布は地域ごとにかなり違いがあることが分かると思います。
【視覚化コンポーネント】
視覚化のためのノード群をコンポーネントにまとめ、ダッシュボードを編集しました。
結果:
左上のBar Chartを選択すると、選ばれた地域の国別リストがTableにインタラクティブに表示されます。
例えばアジアは比較的(平均)議席占有率が低い傾向がある中で、日本の国会では10%を切っていることなどが見て取れます。
また、今回の手法を用いても香港の現状を知ることは出来なかったです。
加えて、このように各国で大きく事情が異なるので、平均値だけを示しても地域の特性が分かりにくいのではと考えて設置したのが右上のBox Plotです。
全画面拡大ボタン(十字矢印アイコン)があるので大きく広げて閲覧することをお勧めします。
さらに右上端のメニューボタンから他の数値データの分布も閲覧設定できます。
HDI Rankは小さい数字が上位ですので下へ行くほど高順位なので見方に注意ですが、地域差が大きいです。
以下は技術面の補足です。
Bar Chartノードはまっきーさんの解説が世界一詳しいのではないかと思っています。
BoxPlotについては以下の2記事を紹介しておきます。
以上で解答内容の説明を終わります。
WFについては本記事へのリンクなども追加して更新予定です。
ここまでお読みいただきありがとうございました。
おまけ:
【空白値についての感想】
いろいろと解析しようとすると、各データの空白値に本当に悩まされました。
香港はどうしたら良い参考データが入手できるのでしょうか?
注目しているのはこちらのサイトです。
課題は解答を完了したもののもう少し調査を進めてみるつもりです。
またHDI RankもTuvaluに関しては算出されていません。
世界情勢を知るためにと各機関がデータ収集に尽力してくれてはいても、各国の事情で情報が得られないこともままあるのだと知ることができました。国連の常任理事国ですら、情報提供されていないのですね。むしろ必然なのかもしれませんが。
記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。