桜で見る会議録 - 参議院議会の可視化
こんにちは。2022年7月の参院選がもうすぐですね。投票先はもう決まりましたか?私はまだです。そもそも参議院って何を話してるんでしょう?私はよく知りませんでした。参議院は6年任期で、3年で半数を入れ替えるそうです。つまり3年に一度、通常選挙が行われます。それではこの3年間、参議院の議会では誰がどんな議論をしてきたのでしょうか。それを可視化してみました。
はじめに
調べてみたところ、前回選挙からの3年間で参議院の議会における発言数は約15万回でした。その全ての発言を解析し、特殊な可視化手法で表現しました。
下の画像かこちらをクリックするとウェブアプリ版で閲覧できます。10MBのデータ量を読み込みますので、閲覧はWiFi環境でどうぞ。
これは何?
この木には、参議院議会の発言一つ一つが埋め込まれています。例えば下図のように木の左上の箇所をクリックすると、2022年4月14日の小西洋之、林芳正、岸信夫(敬称略)による「ウクライナ/PKO/侵略/友好」に関する議論と出てきます。キーワードから何となく内容が想像できるかと思います。
さらに、ポップアップの「会議録を見る」の部分をクリックすると、下図のように情報元である国会会議録にリンクします。概要情報を見て興味が湧いたら、実際にどんな議論が交わされたのかを確認してみましょう。
どのエリアにどんな議論が配置されているかは、表示されているラベルで大まかにわかります。上述の例で示した付近には「防衛」などのラベルが貼られており、防衛や戦争に関係する議題がこの周辺に集まっていることを示しています。
拡大してみると・・
ウェブアプリは地図のように操作可能で、拡大していくとピンク色の点が花びらのように無数に散らばっているのが見えてきます。これは会議録の連続する5発言=1点としてまとめたもので、各点に「いつ」「誰が」「何の」話をしたかが含まれています。先ほどのポップアップはこの一つ一つの点をクリックしていたわけです。
政党ごとに特徴あり
もう一つの機能として、左上の選択ボックスから政党名を選ぶことで、各党ごとのヒートマップに書き変わります。
これにより、各党が集中的に議論していた箇所がわかるようになっています。なお、政党によってトータルの発言回数にかなり差がありますが、このヒートマップは各党の相対値で評価しています。
細かい話はさておき、実際に各党の絵を並べて違いを見てみましょう。
発言回数が限られている政党は、特にどの分野に重点を置いていたかが分かりやすいですね。
さて、ここに出てこない政党は?と思われるかもしれませんが、今回取得した参議院の過去3年間の記録では、これ以外の党派による発言は見られませんでした。
なぜ作った?
選挙が近づくと各党が公約(マニフェスト)を出しますが、これって実現を保証してくれるわけでもないよなぁ・・と、ちょっとモヤモヤしていました。
耳あたりの良い目標よりも、成果や普段からの活動実績を少しでも知りたいと思ったわけです。
ただ、政治活動ってとてもお堅いしわかりづらい。そこを何とか楽しくポップに表現できないかと考えて、この桜模様のデザインに辿り着きました。
どうやって作った?
ここは技術的な話になるので、興味ある方だけご覧ください。一言でいうとプログラミングですが、先人の様々な努力の成果を活用させていただいております。
まずデータ元である国立国会図書館の国会会議録検索システム。これはAPIが用意されていて、簡単なプログラムを準備すればデータを機械処理しやすい形で記録を取得できます。おかげさまで3年間15万件に及ぶ発言記録も10分程度で取得できました。
次に、データ整形・文書解析といった処理です。いわゆる自然言語処理と呼ばれる技術で、これはPythonで実装しています。各発言を単語に分解して(形態素解析)、その中からキーワードを抽出(Tf-Idf)、さらに文章の概念的な意味を多次元ベクトル化(分散表現)、それを2次元の座標値に投影(次元削減)といった工程を経て、文書情報を点群データに変換します。
続いて、ヒートマップの基準となる密度分布の計算です。桜の葉や花のような模様は点密度に応じて色を決めていますが、これは図を小さな六角形のグリッドで分割し、各グリッドにおける点密度を計算、その値をJenks自然分類という手法で10段階のレベルに分類します。この工程もPythonで実装しています。
最後に可視化です。これには地図で使われる技術、具体的にはQGISやMapLibreといったオープンソースソフトウェアを利用しています。データ形式の変換をQGIS、ウェブアプリ化をMapLibreで行なっています。
名称について
こちら「桜を見る会」を捩った名称を採用しておりますが、作ったウェブアプリのデザインイメージと語呂がマッチしていたので採用したまでで、特にその件を揶揄する意図はありません。
出典・免責事項
当記事の情報は、国会会議録検索システム(国立国会図書館)をもとに筆者が独自に加工し、考察した内容となります。正しく公正な情報を提供するように努めてはおりますが、必ずしも正確性を保証するものではありません。
この記事が気に入ったらサポートをしてみませんか?