見出し画像

【JKI】007_Women_in_ Government_02_視覚化への考察

【JKI_007挑戦中】課題残件を確認

Just KNIME It! (JKI)

より

課題7:政府の女性
レベル:中
説明:
このチャレンジでは、1つ以上の視覚化を作成して、国連開発計画:人間開発報告書で報告されているように、地方自治体の女性が保有する議席の割合を調査します。この報告書の目的は、「政治的、経済的、公的生活におけるあらゆるレベルの意思決定において、女性の完全かつ効果的な参加とリーダーシップの機会均等を確保すること」です。これは実際のデータセットであるため、欠落している値があり、独自の創造性によってデータを拡張することを期待しています。特に、国別のデータだけでなく、大陸のデータも報告していただきたいと思います。ここでの真の課題は、この不完全なデータセットを1つ以上の視覚化に変換する方法と、この課題に適していると思われる視覚化です。チャレンジの概要は次のとおりです。
1.データセットをダウンロードして、KNIMEに取り込む最も効率的な方法を決定します
2.最も効率的と思われる方法を使用して大陸列を追加します
3.データを視覚化します(KNIMEソリューションは国と大陸の両方に関連するデータを視覚化します)

(Google翻訳して引用)

2までは解答内容を紹介してきました。

【新たな指標の提案】

「地方自治体の女性が保有する議席の割合」データは空白値が多いため、各自の工夫で目的に合った情報を得るためデータ拡張することを求められています。

私は地方自治体の代わりに国会における同様のデータを参考値として別カラムとして加える手法を採用しました。
ではその後大陸もしくは地域別にデータを集計する場合にどうするか。

国会のデータに関しては空白値は少ないのですが、だからといって国会データだけで集計してしまっては課題のデモデータの情報を利用していないことになります。
そこで今回は下記の計算値「(平均)議席占有率」を視覚化などで用いる指標に提案します。

(平均)議席占有率:

地方自治体と国会それぞれにおける女性の議席占有率の相加平均とする。
ただしどちらか一方のデータが欠損している場合はデータがある方の議席占有率をそのまま用いる。

今回は地方自治体データのみがある国はありませんでした。よって条件分岐は地方自治体データの有無の2つのみとなります。

KNIMEでは下図のWFで算出しました。視覚化のための数値の丸め込み処理も行っています。

結果:

今回このような新指標を提案した理由の一つには、地方自治体データが示されていない国に、米国、中国、ロシアと世界情勢を考えるに注目せざるを得ない国々も含まれていたことがあります。世界に平和もしくは危機をもたらす国々であることは今まさに皆さんも実感されていることと思います。
これらの国々のデータなしで地域別の集計をしてその地域の特性を調査できるものだろうかと考え、新指標を今後の解析に用いることとします。

【視覚化のためのデータ前処理】

視覚化の前に必要なデータをそろえ、行列を整列したのが上記WFです。

最も重要なパートであるGroupByノードの設定を以下に示します。

技術面はまたもまっきーさんの記事を紹介するに留めます。

設定:

Column Renameで表示名を整えたのちの結果を以下に。

地域別の(平均)議席占有率以外にもLDC数などの数値を算出しました。

その地域の特徴を知るための参考になればと考えました。実際これらの値の分布は地域ごとにかなり違いがあることが分かると思います。

【視覚化コンポーネント】

視覚化のためのノード群をコンポーネントにまとめ、ダッシュボードを編集しました。

結果:

左上のBar Chartを選択すると、選ばれた地域の国別リストがTableにインタラクティブに表示されます。
例えばアジアは比較的(平均)議席占有率が低い傾向がある中で、日本の国会では10%を切っていることなどが見て取れます。

また、今回の手法を用いても香港の現状を知ることは出来なかったです。

加えて、このように各国で大きく事情が異なるので、平均値だけを示しても地域の特性が分かりにくいのではと考えて設置したのが右上のBox Plotです。

全画面拡大ボタン(十字矢印アイコン)があるので大きく広げて閲覧することをお勧めします。

さらに右上端のメニューボタンから他の数値データの分布も閲覧設定できます。

HDI Rankは小さい数字が上位ですので下へ行くほど高順位なので見方に注意ですが、地域差が大きいです。

以下は技術面の補足です。

Bar Chartノードはまっきーさんの解説が世界一詳しいのではないかと思っています。

BoxPlotについては以下の2記事を紹介しておきます。

以上で解答内容の説明を終わります。

WFについては本記事へのリンクなども追加して更新予定です。

ここまでお読みいただきありがとうございました。



おまけ:

【空白値についての感想】

いろいろと解析しようとすると、各データの空白値に本当に悩まされました。

香港はどうしたら良い参考データが入手できるのでしょうか?

注目しているのはこちらのサイトです。

課題は解答を完了したもののもう少し調査を進めてみるつもりです。

またHDI RankもTuvaluに関しては算出されていません。

世界情勢を知るためにと各機関がデータ収集に尽力してくれてはいても、各国の事情で情報が得られないこともままあるのだと知ることができました。国連の常任理事国ですら、情報提供されていないのですね。むしろ必然なのかもしれませんが。

記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。