スクリーンショット_2019-04-09_9

議事録サマリー1

息子のはじめての選挙の参考になにか出したいとはじめたプログラム、先週末4/7におこなわれた千葉県議会議員選挙までに一旦何か出したいと思い。強引なまとめをしました。

要約するぞ!

前回までためしていた、word embeddingで単語の重みを出す方法だと、一般的な言葉だとそれなりに近い意味、使われ方のものをまとめてくれるのですが議員さんの名前だともともと議事録では先頭くらいしか議員さんの名前が明記されないということもあり あまりその人の特性を掴んだ言葉を表示するというところまでいきませんでした。 分析、重みの学習方法に工夫のしどころは地道に考えるとして、週末までまにあう別のまとめかたを考えました。 議案ごとの賛成、反対を集計するだけでも意味があるかと思ったのですがそれも調べてみるとほとんどの議員がどの議案にも賛成している状況なので役にたたないことが分かりました。せっかく大量に地方議会の議事録がDLできるようになったので、その議事録を活かすことを考えると、議員さんごとの議会での発言、質問内容を要約するというのがまず分かりやすいのではないかと考えました。

段落の区切りと、発言者の抽出

議員さんごとの発言を要約するために誰の発言がどこからどこまでかを区切らないといけないです。四街道市と、千葉県議会の2つしかまだみていませんがどちらも議事録という特性上冒頭に発言者名がかかれています。

[四街道市議会 議事録例]
○戸田由紀子議長 日程第3、施政概要の説明を行います。
  施政概要の説明を求めます。
  市長、佐渡斉さん。
    〔市長 佐渡 斉登壇〕

◎市長(佐渡斉) 本日、ここに平成30年第3回四街道市議会定例会を招集いたしましたところ、議員各位にはご参集をいただき、まことにありがとうございます。
  本定例会に提案いたしました案件につきましては、よろしくご審議くださいますようお願い申し上げます。
[千葉県議会 議事録例]
◯議長(本間 進君) 水野友貴君の質問に対する当局の答弁を求めます。知事森田健作君。
    (知事森田健作君登壇)

◯知事(森田健作君) 我孫子無所属の会、水野友貴議員の御質問にお答えいたします。
 きょうは支援者の皆様、そして諸先生方、ようこそおいでくださいました。
 手賀沼の環境保全についてお答えいたします。
 手賀沼の水質改善の進捗状況についての御質問でございますが、手賀沼は流域の急激な都市化の進行により、昭和40年代後半から水質が悪化したため、県では水質改善に向けた対策に取り組ん

区切り文字(prefix)として○や◎を検出し、そこから役職などつくこともあるのでn文字(name_index)以内に、名前(性、名)で検索すれば検出できそうです。コードにすると以下のようにかけます。

def name_filter(path,prefix,name_index,name1,name2,encode='shift_jis'):
    f = open(path,encoding=encode)
    data = f.read()
    f.close()
    texts = data.split(prefix)
    targetTexts = [text for text in texts if (0 <= text[0:name_index].find(name1) and 0 <= text[0:name_index].find(name2) ) ]
    return targetTexts

そしてTokenに切り出しますが、重要な単語にしぼりたいので以下の品詞の単語だけにします '名詞', '形容詞', '副詞', '動詞'。

いよいよ要約ですが今回はsumy というpythonの要約ライブラリを使ってみます。以下のReadmeを見てもらうとbasicからTextRank等さまざまな論文をもとに実装してくれていますので比較してみたいと思います。

Tokenizeした文字列にたいして以下のコードで要約を実施してみます。

from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.luhn import LuhnSummarizer
from sumy.summarizers.lsa import LsaSummarizer
from sumy.summarizers.edmundson import  EdmundsonSummarizer
from sumy.summarizers.kl import  KLSummarizer
#from sumy.summarizers.reduction import  ReductionSummarizer
from sumy.summarizers.sum_basic import  SumBasicSummarizer
from sumy.summarizers.text_rank import  TextRankSummarizer
from sumy.summarizers.lex_rank import LexRankSummarizer

def summarize(path,pref,name_index,name1,name2,count,debugLevel):
    org_texts = name_filter(path,pref,name_index,name1,name2)
    corpus = Wakati(org_texts)
    parser = PlaintextParser.from_string(''.join(corpus), Tokenizer('japanese'))

    summarizerSB = SumBasicSummarizer()
    summarizerSB.stop_words = [' ','。']  
    summarySB =summarizerSB(parser.document,count)    

    summarizerEd = EdmundsonSummarizer()
    summarizerEd.stop_words = [' ','。']  
    summarizerEd.bonus_words = ['ヤード','予算']  
    summarizerEd.null_words = [' ','。']
    summarizerEd.stigma_words = ['環境']  
    summaryEd = summarizerEd(document=parser.document, sentences_count=count)    

    summarizerKL = KLSummarizer()
    summarizerKL.stop_words = [' ','。']  
    summaryKL =summarizerKL(parser.document,count)    

  
    summarizerLR = LexRankSummarizer()
    summarizerLR.stop_words = [' ','。']
    summaryLR = summarizerLR(document=parser.document, sentences_count=count)    

    summarizerTR = TextRankSummarizer()
    summarizerTR.stop_words = [' ','。']  
    summaryTR = summarizerTR(document=parser.document, sentences_count=count)    

    summarizerLu = LuhnSummarizer()
    summarizerLu.stop_words = [' ','。'] 
    summaryLu =summarizerLu(parser.document,count)    
    
    summarizerLsa = LsaSummarizer()
    summarizerLsa.stop_words = [' ']  
    summaryLsa =summarizerLsa(parser.document,count)    

    
    if(0<debugLevel):
        print("------------------------------------------------------------------")
        print(name1,name2,"さんの議事録発言サマリー",path)
        print("Sum_Basic============================")
        i = 1
        for text in summarySB:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("Edmunson============================")
        i = 1
        for text in summaryEd:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("KL============================")
        i = 1
        for text in summaryKL:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("LexRank============================")
        i = 1
        for text in summaryLR:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("TextRank============================")
        i = 1
        for text in summaryTR:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("Luhn==============================")
        i = 1
        for text in summaryLu:
            print("summary" + str(i) )
            print(text)
            i+=1
        print("Lsa==============================")
        i = 1
        for text in summaryLsa:
            print("summary" + str(i) )
            print(text)
            i+=1
    if(1<debugLevel):
        print(name1,name2,"さんの発言原文")
        print(org_texts)
    return summary,org_texts

2019年千葉県議会選挙で四街道地区の候補となっている以下の議員さんの2018年の議会での発言を要約してみます。(もう一名新人の方が立候補して3名による戦いなのですが新人の方は要約できないのがこの方式の限界です。)

要約例 鈴木さん

すべての方式を載せると長くなるので代表的な例をいくつかpickupします。
元の発言が20000文字A4 15ページのものが短いもので1400文字2ページ程度に要約されています

summarize('./00_poly/chiba2018/','◯',20,'鈴木','陽介',12,debugLevel=1)    

------------------------------------------------------------------
鈴木 陽介 さんの議事録発言サマリー ./00_poly/chiba2018/

Sum_Basic============================
#Basic方式 ちょっとシンプルすぎます
summary1
財政 課 よる 今期 予算 17 , 289 億 円 事業 数 1 , 704 事業 こと 予算 策定 過程 見直す れる 事務 事業 314 件 額 223 , 300 万 円 内訳 経費 節減 等 20273 , 300 万 円 事業 縮小 66101 , 100 万 円 負担 金 補助 金 見直し 159 , 600 万 円 事業 廃止 終了 3139 , 300 万 円 こと 廃止 する れる 事業 うち 最も 長い 続く の 千葉 県 青少年 協会 助成 事業 年度 2 , 800 万 円 昭和 4152 年間 続く 最も 金額 大きい 廃止 事業 被災 者 住宅 再建 支援 金 事業 年度 15 , 900 万 円 新規 事業 48185 , 900 万 円 警察 移動 無線 通信 システム 更新 最大 規模 年度 45 , 800 万 円 最小 若者 中小 企業 理解 ため インターンシップ 促進 事業 1 , 100 万 円 残り 継続 5 , 418 億 円 規模 こと。
summary2
健康 づくり 伺う。
summary3
千葉 県民 平均 寿命 健康 寿命 年々 伸びる おる 男性 平均 寿命 80 . 96 歳 健康 寿命 72 . 37 歳 女性 ほう 平均 寿命 86 . 91 歳 健康 寿命 75 . 17 歳 なる おる 平均 寿命 健康 寿命 1 年 当たり 伸び 右側 ところ 書く おる 男性 ほう 少し 問題 ある 平均 寿命 伸び 健康 寿命 伸び 少ない こと なる おる 全国 男女 平均 寿命 上回る 健康 寿命 伸び 達成 する れる おる 1 ページ 目 等 書く ある 都道府県 ごと 健康 寿命 順位 見る 男性 平成 2271 . 62 32572813 位 こと だんだん 下がる いる 女性 272018 位 徐々に ランキング 上げる おる 気 なる の 資料 ある よう 男性 トップ 差 どんどん 離れる しまう いる 点 女性 なかなか 近づく 点。
summary4
バリアフリー 推進 伺う。
summary5
端的 伺う 県 有 施設 バリアフリー 現状 実態 把握 進める 考える 県 取り組み 方針 どう。
summary6
医療 的 ケア 必要 子供 支援 伺う。
summary7
地域 公共 交通 維持 確保 伺う。
summary8
働く 方 改革 質問 する せる いただく。
summary9
GAP 先進 県 目指す 取り組み 伺う せる いただく。
summary10
2 県 農業 者 外国 人 含める 雇用 管理 よう 支援 する いる の。
summary11
インフラ 老朽 化 対策 伺う。
summary12
そこ 伺う 県内 横断 歩道 補修 方針 進捗 状況 どう

LexRank============================
# LexRank google の検索エンジンの基本アルゴリズムを参考にした要約です
# Summary間の分量が安定していなくSammry11,12がやたら長いのでいまいち
summary1
そこ 伺う 普通 会計 経常 収支 比率 100 % 近づく あり 積極 的 事業 進める いく 不安 懸念 感じる 得る 県 状況 どう 分析 する の 事務 事業 充実 発展 ため 財源 確保 見通し 今後 財政 運営 あり方 見解 どう。
summary2
そこ 伺う 東葛飾 土木 事務所 官製 談合 事件 踏まえる 職員 行為 県民 疑惑 不信 招く よう する ため よう 点 留意 する 条例 提案 する 規則 制定 する の。
summary3
そこ 伺う 条例 見直し 制度 上 よう 担保 する れる いる の。
summary4
端的 伺う 県 有 施設 バリアフリー 現状 実態 把握 進める 考える 県 取り組み 方針 どう。
summary5
そこ 伺う 現在 保育 所 等 医療 的 ケア 必要 子供 受け入れ 状況 どう なる いる 今後 取り組み よう 考える いる の。
summary6
そこ 伺う 地域 公共 交通 維持 確保 向ける 県 どう 取り組む いる の。
summary7
2 規模 災害 発生 時 的確 対応 図れる よう 県 インフラ ライフライン 事業 者 よう 連携 図る いく の。
summary8
2 条例 施行 38 カ月 経過 する 自動車 ヤード 実態 把握 取り組み 結果 どう 不法 ヤード 撲滅 向ける 課題 よう 分析 する いる の。
summary9
働く 方 改革 質問 する せる いただく。
summary10
手元 資料 一番 最後 ページ ごらん くださる 先 午前 中 山本 議員 質疑 本年 県内 交通 事故死 者 昨年 大きい 上回る ペース ふえる おる 11 月末 時点 事故死 者 先 本部 長 答弁 ある 前年 同期 比 33 人 増 167 人 全国 ワースト 2 位 うち 歩行 中 事故死 者 48 人 少ない ある 私 地元 四街道 市 昨年 ゼロ もの 6 大幅 ふえる おる 交通 死亡 事故 多発 伴う 1122 日 知事 緊急 メッセージ 発する 至る おる 信号 機 ない 横断 歩道 渡る する 人 いる 車 一時 停止 する 横断 歩行 者 妨害 違反 これ 後 絶つ 本年 10 月末 現在 歩行 中 交通 事故 2 , 317 件 うち 712 人 横断 歩道 上 事故 遭う 死傷 する おる もはや 横断 歩道 安全 言える なる いる の ある 横断 歩道 果たす 役割 見詰める 直す 歩行 者 守り抜く 対策 急務 考える。
summary11
鈴木 陽介 君 答弁 いただく 順次 要望 質問 する せる いただく まず 財政 要望 する せる いただく 経常 収支 比率 高 どまり する いる 高い 状態 続く いる 厳しい 財政 認識 はっきり 伺える 状況 実際 見直す れる 見直し 全部 行う いる こと ん 義務 的 経費 以外 動き ある 事業 全体 予算 規模 見る 本当に ごく わずか 既存 事業 うち 効果 低い 事業 役割 終える 見直し しっかり なす れる よう 明確 評価 基準 設ける 予算 編成 行う よう 要望 する せる いただく これ 延長 上 ちょっと 県 財政 未来 私 たち 思う おる なぜ 見直す の なぜ 廃止 する の なぜ 新規 始める の なぜ そのまま 続ける の 私 たち もっと 見える よう 予算 編成 する いただく 健康 財政 県民 暮らし 持続 可能 性 高める 大切 税金 使い方 今 問う れる いる 中 予算 編成 体質 改善 これ 強い 求める させる いただく 医療 的 ケア 児 支援 要望 いたす 平成 2526 年 モデル 事業 在宅 医療 課題 抽出 機関 連携 患者 家族 支援 一定 成果 ある これ 私 たち 評価 する せる いただく やはり モデル 事業 終了 後 中断 する れる しまう 生かす れる いる 事業 複数 ござる 地域 医療 福祉 資源 わかる やすい 伝える ため 千葉 県 つながる マップ これ 当時 資源 わかる 便利 思う ん 情報 更新 一切 する れる いる 在宅 生活 支援 する サービス 活用 パンフレット これ つくる ん 1 度 つくる そのまま こと 適切 情報 提供 資源 有効 活用 医療 的 ケア 児 家族 大変 重要 モデル 事業 手がける もの やりっ放し 県 施策 ぜひ 生かす いただく 思う 要望 いたす 県内 1 , 100 ある 保育 所 等 うち 医療 的 ケア 児 受け入れる られる 表明 する いる ところ 60 施設 実際 受け入れる いる の 16 施設 16 人 こと 実態 把握 する おる 明らか ニーズ 追いつく いる の 思う 社会 的 支援 成熟 の 保育 所 落ちる ある 医療 的 ケア 必要 子供 望む どこ 受け入れる られる 体制 つくる こと 県 責務 ある 補助 事業 実施 する モデル 事業 行う 自治体 なる 受け入れ 実績 ある 施設 園長 保育 士 さん 話 聞く 考える 看護 師 直接 雇用 する 訪問 看護 師 園 訪問 する 受け入れ 可能 なる いる ケース 県内 ござる 必要 人的 財政 的 支援 拡充 する いただく よう 要望 する せる いただく あわせる 現在 千葉 リハビリテーション センター 委託 する 調査 分析 行う いる 医療 的 ケア 児 実態 把握 結果 踏まえる 来年 4 月 市町村 体制 支える こと できる よう 県 支援 要望 する せる いただく 次に 地域 公共 交通 維持 確保 要望 する 県 市町村 連携 する 地域 公共 交通 機関 住民 意見 これ 十分 聴取 する 交通 政策 反映 する れる よう お願い いたす テーマ 会派 天野 議員 一般 質問 より 詳細 政策 提言 する せる いただく よろしく お願い いたす 規模 災害 発生 時 インフラ ライフライン 要望 いたす 答弁 ある 千葉 県 ライフライン 対策 連絡 協議 会 これ 構成 メンバー 教える いただく ここ 課題 共有 深める 担当 者 同士 顔 見える 関係 ぜひ 構築 する いただく 思う おる 県 よう インフラ ライフライン これ 民間 公共 関係 ない よう ライフライン インフラ 支える られる いる の 平時 しっかり つかむ おく 必要 ある 思う ん 有事 際 どう なる しまう の 県 被害 想定 含める 把握 する 的確 迅速 対応 つなげる 研究 する いただく これ 要望 する せる いただく よろしく お願い する 農業 雇用 問題 要望 する 外国 人 技能 実習 生 受け入れ 法令 遵守 ため 労務 管理 人 人 関係 農業 者 技能 実習 生 お互い コミュニケーション 図る 信頼 関係 構築 する いく こと 重要 考える 引き続き 農業 者 技能 実習 生 適切 受け入れる よう 啓発 支援 指導 行う いただく よう 要望 いたす 次に インフラ 老朽 化 対策 要望 する 今後 ホームページ 充実 する せる インフラ 点検 修繕 状況 わかる やすい よう 行く いく 情報 提供 する いく こと これ ぜひ 推進 する いただく ん 現在 非常 わかる づらい 情報 提供 形 なる おる そこ 改善 する お話 ある ぜひ 可能 限り 直感 的 視覚 的 県民 わかる やすい 情報 提供 努める いただく 思う 県内 市町村 ごと 老朽 化 対策 進め方 進捗 格差 ある 放置 する わけ いく 答弁 情報 共有 支援 こと もう 一 歩 踏み込む 今後 ぜひ 人的 財政 的 支援 あり方 検討 願う 次に スクール サポート スタッフ 要望 する せる いただく 先日 試験 的 導入 する いる 中学校 教員 さん 話す 機会 ある 大いに 感謝 する れる おる 印刷 する 原稿 クラス 別 印刷 部数 明示 する 依頼 書 つくる 代行 する いただく 仕事 量 大幅 軽減 できる こと 教職員 多忙 化 解消 ため 仕事 量 軽減 する 教職員 総数 ふやす 解決 策 ない こと 明白 思う スクール サポート スタッフ 県内 公立 小中学校 配置 これ 要望 する 多忙 化 解消 課題 これ どんどん 出る くる 思う それ まとめる 根本 的 解決 策 教職員 増員 国 継続 する 働きかける いただく よう お願い いたす 交通 安全 政策 要望 する せる いただく 本当に 横断 歩道 摩耗 対策 対応 する いただく 著しい 摩耗 する いる 箇所 一部 摩耗 通学 路 等 優先 する 箇所 実態 把握 補修 進める いただける こと 今年度 中 補修 完了 ぜひ お願い いたす 信号 機 信号 柱 根元 折れる 亀裂 入る 非常 驚く これ 老朽 化 対策 もちろん 万全 やる いただく いる 思う こと 起きる いる これ 老朽 化 対策 上乗せ する 地域 耐用 年数 見直し 検査 実施 頻度 ふやす 工夫 する 検討 願う 今 時期 薄暮 時 子供 たち 下校 時 重なる ドライバー 歩行 者 啓発 加える 真に 危険 箇所 時間 帯 対策 県警 挙げる 実施 する いただく よう お願い いたす 早川 本部 長 おく れる 一 人 多く 県民 救う れる 日本一 安全 千葉 県 目指す いただく 交通 安全 施策 全力 注ぐ いただく 要望 する せる いただく 次 質問 含む 項目 申し上げる まず 倫理 条例 伺う 県民 疑惑 不信 招く よう 行為 する なる これ 条例 案 33 項 書く ある 原則 私 たち 重要 考える 利害 関係 者 国 拡大 する こと 禁止 事項 設定 グレー ゾーン 例外 規定 極力 ない する 同様 事件 二度と 起こす 制度 設計 する 考える 禁止 事項 遵守 もちろん こと グレー 会合 等 かかわる 職員 自身 判断 する 行動 できる 職場 環境 づくり 要望 いたす ケース 禁止 事項 判断 難しい こと ある 思う れる そこ 伺う 禁止 行為 該当 する 否 職員 判断 迷う こと ある 得る 場合 よう 対応 図る の 次に 健康 づくり 伺う 健康 ちる 21 目指す 目標 ツートップ 1 健康 寿命 延伸 2 目 県内 市町村 健康 格差 分析 縮小 再び 先 資料 戻る せる いただく 健康 寿命 伸び 先 申し上げる よう 男性 ほう 平均 寿命 伸び 追いつく いる 資料 2 枚 目 市町村 別 健康 寿命 載せる おる 県内 市町村 健康 格差 むしろ 広がる しまう いる 具体 的 市町村 名 ここ 書く ある ここ 申し上げる 非常 3 歳 違う わけ 女性 3 歳 男性 2 . 3 歳 これ ぜひ 底上げ 改善 図る いただく 思う おる 危機 意識 持つ 計画 後半 戦 臨む いただく 思う 働く 世代 課題 ある 答弁 保険 者 通じる 会社 働きかけ 健康 経営 取り組み 支援 ぜひ 進める いただく 世代 働く 世代 政治 行政 関心 割合 高い 傾向 あり 個 人任せ より 直接的 アプローチ 必要 考える 部局 健康 づくり 働きかけ する くださる こと 特に 働く 世代 睡眠 就労 時間 今回 扱う 働く 方 改革 連動 大変 重要 考える そこ 伺う 健康 福祉 部 商工 労働 部 お互い 施策 最大 化 する ため よう 連携 協 働 図る いく の 伺う バリアフリー つく 県 有 施設 現状 一つ 一つ 実態 調査 する 重要 方針 示す れる 一 歩 思う さらに 提案 ん 実態 把握 終わる せる ばらばら バリアフリー 取り組み これ ぜひ 見直す いただく 課題 改善 中心 的 担う バリアフリー 対策 推進 組織 今 必要 考える そこ 伺う 今 バリアフリー 部局 横断 的 主体 的 推進 する 体制 整備 する 考える 県 今後 よう 対応 する いく ヤード 伺う 立ち入り 不法 残留 外国 人 盗難 車両 発見 多く 指導 なす れる 実態 把握 進む 考える 中 届け出 どおり 運営 する れる いる いつ 指導 従う ヤード 条例 求める 厳正 対応 着実 講ずる 考える 外国 籍 運営 者 言語 違い 確か ハードル 厳正 対応 保留 する 続ける 結果 本県 豊か 自然 住環境 脅かす れる 条例 趣旨 反す そこ 伺う 指導 事項 票 発行 状況 どう 指導 実効 性 確保 する ため よう 対応 図る いく の GAP 伺う 指導 者 国 県 認証 費用 補助 制度 充実 する 取得 環境 整う ある こと わかる 将来 担い手 GAP 教育 これ 随分 確立 する れる くる 進む いる 今後 期待 する おる やはり 消費 者 流通 小売り 業者 GAP 理解 する もらう 動き まだ 足りる 感じる 消費 者 間 食 安心 同列 社会 環境 配慮 する エシカル 消費 これ 倫理 的 消費 そう 関心 高まる いる 報道 よる イオン さん 現在 環境 労働 安全 配慮 する 食材 扱う 動き 広がる グローバル GAP 取得 する 農場 つくる 野菜 GGN ラベル もの つける いる そう 全て 生産 工程 見える 化 する 安全 安心 意識 する 消費 者 取り込み 目指す 動き ここ ちょっと 提案 ん 県 もち GAP これ 県 独自 やる いる もの ちる GAP ラベル 等 作成 する GAP 推進 意義 訴える 県内 スーパー 等 並べる もらう 食 絡む イベント ところ 認知 度 高める 努力 する みる いかが 東京 オリパラ オリンピック パラリンピック 千葉 県 産 農産物 提供 する 認証 受ける いる 食材 活用 する もらう よう メニュー づくり 組織 委員 会 ケータリング 会社 ぜひ 働きかける いただく 思う おる オリンピック パラリンピック 推進 局 連携 する ぜひ 動く いただく これ もう 余り 時間 ない そう ん 前回 GAP 推進 大会 国 方 おっしゃる いる すぐ ケータリング 会社 決まる そう どんどん 県 千葉 県 食材 使う くださる ちる GAP 使う いる 品目 使う くださる よう メニュー づくり 要望 する いただく 今 肝心 お願い いたす 以上 申し上げる こと 鑑みる 県内 中 GAP 浸透 する せる ため 農林 水産 部 以外 部局 環境 生活 健康 福祉 商工 労働 等 協力 する もらう いける 食 安全 県民 期待 東京 オリンピック パラリンピック きっかけ GAP 先進 県 目指す 考える 今後 よう 戦略 的 推進 する いく の 以上 2 問 目 する せる いただく。
summary12
鈴木 陽介 君 最後 3 問 目 する せる いただく 答弁 まず ヤード 発言 する せる いただく たび 重なる 指導 従う 運営 者 実際 いらっしゃる わけ ぜひ 厳しい 態度 臨む いただく ん 今 答弁 期限 過ぎる 期限 設ける いる 期限 過ぎる 指導 ん それ 重なる 重なる いる 上 厳しい 対処 なる の そこ せっかく 期限 定める いる の なかなか 進む の ちょっと これ 少し 甘い の 思う ぜひ 厳しい 態度 臨む いただく 不法 ヤード 撲滅 する せる いただく 思う おる よろしく お願い する これ 立ち入り 指導 重ねる いただく いる すごい 数 やる もらう いる 2 , 500 弱 これ 立ち入る 指導 重ねる 一 たび 環境 汚染 犯罪 起きる しまう 県民 健康 財産 脅かす れる 火災 起きる やすい 季節 条例 違反 ヤード とにかく 厳しい 対応 する くださる お願い いたす GAP ぜひ これ 議場 いらっしゃる 皆さん GAP 盛り上げる いただく 思う おる 農産物 話す ん 非常 これ 取り組み ん GAP 推進 大会 私 参加 する 専門 家 方 国連 進める いる 持続 可能 開発 目標 これ SDGs これ GAP 非常 強い 関連 性 ある 議論 ある すごい 興味深い GAP 推進 17 ある SDGs グローバル ゴール うち 健康 水 土壌 気候 変動 対策 経済 発展 生物 多様 性 6 ゴール 寄与 する 言う れる おる GAP 進める こと 農業 県 全体 持続 可能 性 つながる わけ 県庁 全体 県民 流通 小売り 生産 者 オール 千葉 GAP 盛り上げる 考える お願い いたす 2 年 後 迫る 東京 オリパラ 1 契機 GAP 県内 中 知る しめる 東京 オリパラ レガシー GAP 先進 県 千葉 目指す みる いかが 動き 全力 応援 する せる いただく バリアフリー バリアフリー 部局 横断 的 進める 庁 内 連絡 会議 新た 設置 する 答弁 これ 一 歩 思う ぜひ これ 縦 割り バリアフリー 格差 これ 是 正す バリアフリー 水準 高める いただく 思う 今回 障害 ある 利用 者 方 声 宝 感じる 新た 組織 実態 把握 課題 対策 あわせる 声 集約 する 対策 生かす 体制 づくり ぜひ お願い いたす 今後 組織 方針 づくり ぜひ 検討 する くださる 県 有 建物 長 寿命 化 計画 推進 指定 管理 者 選定 組織 議論 反映 する 高い 水準 求める いく 考える パラリンピック レガシー バリアフリー 都市 目指す 取り組み 期待 する おる 最後 健康 づくり 県庁 全体 さまざま 施策 関連 する せる 行い 健康 寿命 延伸 図る 考える 現状 部局 施策 健康 づくり 観点 取り入れる こと できる さらに 事業 意味 効果 高まる こと 期待 する れる 縦 割り 枠組み 中 効果 限定 的 なる しまう いる 事業 たくさん ある の 健康 づくり 県庁 全体 推進 する ため 体制 整備 根拠 なる 条例 制定 提案 する せる いただく まず 健康 福祉 部 総合 的 健康 づくり 施策 展開 する ため 健康 づくり 対策 監 ポスト 設置 する 部局 施策 連絡 調整 図る いく 7 府県 制定 する れる いる 健康 づくり 条例 本県 検討 する 健康 づくり 総合 的 施策 展開 図る 森田 知事 おく れる 健康 づくり 県 施策 推進 核 なる よう 提案 真摯 検討 いただく よう 要望 する 千葉 民主 会 代表 質問 終わる せる いただく どうも。

Lsa==============================
# LSA 潜在的セマンティック分析
# なかなか良いと思いますが、実際の議事録でかなり長い分量で出ていたヤードの発言がでていないのが残念
summary1
本日 地元 支援 者 方々 傍聴 訪れる いただく 妻 有給 とる ゼロ 歳 息子 来る いる いつも。
summary2
財政 課 よる 昨年度 普通 会計 経常 収支 比率 96 . 3 % 投資 的 経費 財源 おおよそ 234 億 円 こと さらに 今年度 普通 会計 当初 予算 経常 収支 比率 粗 99 . 2 % 試算 する れる おる 投資 的 経費 財源 100 億 円 程度 なる 思う れる。
summary3
本県 医療 介護 取り巻く 状況 人材 不足 財源 厳しい さ 大変 難しい 時代 突入 する いる 2025 年 問題 入り口 すぎる 団塊 ジュニア 世代 75 歳 迎える 2040 年代 状況 続く 私 そう 30 代 以下 県民 厳しい 時代 高齢 者 支える 次世代 健康 的 幸せ 暮らす こと できる 社会 残す 責任 ある 今 健康 づくり 県 施策 見直す こと これから 少子 高齢 社会 生き抜く ため 必須 考える 特に アウト カム 指標 重視 する 効果 期待 できる 事業 予算 重点的 配分 する 取り組み 行う 考える。
summary4
そこ 伺う 地域 公共 交通 運行 住民 意見 反映 重要 考える 県 よう 取り組む いる の。
summary5
本年 9 月 北海道 胆振 東部 地震 北海道 インフラ ライフライン 断絶 する 道民 生活 北海道 経済 打撃 与える 特に 電力 ニーズ 生活 隅々 浸透 する いる ため ブラック アウト 大変 深刻 家庭 もとより 行政 機関 医療 機関 交通 機関 混乱 深める 高橋 はるみ 北海道 知事 事業 者 責任 極めて 重い 道 議会 代表 質問 答弁 する よう 私 たち 少し 違和感 覚える おる 住民 生活 必要 不可欠 インフラ ライフライン 規模 災害 発生 時 ストップ する 際 都道府県 事業 者 一体 なる 住民 生活 立て直し 努める 事業 者 責任 押しつける の おかしい 考える 自分 地域 起きる 得る 被害 想定 できる いる よう 感じる 本県 平時 ライフライン インフラ 扱う 民間 事業 者 自治体 連携 密 する 規模 災害 発生 時 県内 中 よう 被害 生じる 得る 把握 共有 する 初めて 有事 際 的確 迅速 対応 図れる の。
summary6
特に 小規模 企業 者 働く 方 改革 推進 する こと 経営 者 しわ寄せ 経営 者 みずから 長時間 労働 なる しまう こと 危惧す れる 昨年 12 月 議会 会派 代表 質問 ワーク ライフ バランス 推進 小規模 企業 実情 把握 する いる 社会 保険 労務 士 税理士 積極 的 働きかけ 行う 企業 実行 力 きめる 細やか 支援 行う よう 要望 行う くる ところ。
summary7
よう 中 外国 人材 活用 注目 集まる おる 本県 農業 外国 人 雇用 者 多く 外国 人 技能 実習 法 基づく 技能 実習 生 こと 制度 開発 途上 国 発展 寄与 する 国際 貢献 行う れる いる もの 技能 実習 生 受け入れ 農家 雇用 契約 締結 する 同一 農家 もと 通年 実習 行う 技能 習得 する こと なる おる ため 通年 作業 ある 農家 受け入れ 進む おる 季節 農繁期 農閑期 ある 果樹 野菜 扱う 農家 受け入れ 進む にくい 聞く おる。
summary8
外国 人 技能 実習 法 平成 28 年 従来 入管 法 基づく 制度 抜本 的 見直す 制定 する れる おる 昨年 11 月 施行 する れる おる 背景 時間 外 労働 賃金 不払い 適正 事件 多い ある ため 聞く おる 入国 管理 局 公表 資料 よる 平成 29 年 外国 人 不法 就労 者 摘発 場所 別 構成 千葉 県 1 , 505 人 これ 全国 ワースト 2 位 こと 技能 実習 法 施行 する れる 現在 不法 就労 摘発 する れる 例 技能 実習 生 失踪 報道 等 聞く ところ 治安 面 多く 課題 ある 考える おる。
summary9
2 道路 施設 維持 管理 更新 国 県 市町村 間 情報 共有 等 連携 必要 考える 取り組み 状況 どう。
summary10
そこ 伺う スクール サポート スタッフ 配置 事業 有効 性 県 教育 委員 会 どう 認識 する いる の。
summary11
手元 資料 一番 最後 ページ ごらん くださる 先 午前 中 山本 議員 質疑 本年 県内 交通 事故死 者 昨年 大きい 上回る ペース ふえる おる 11 月末 時点 事故死 者 先 本部 長 答弁 ある 前年 同期 比 33 人 増 167 人 全国 ワースト 2 位 うち 歩行 中 事故死 者 48 人 少ない ある 私 地元 四街道 市 昨年 ゼロ もの 6 大幅 ふえる おる 交通 死亡 事故 多発 伴う 1122 日 知事 緊急 メッセージ 発する 至る おる 信号 機 ない 横断 歩道 渡る する 人 いる 車 一時 停止 する 横断 歩行 者 妨害 違反 これ 後 絶つ 本年 10 月末 現在 歩行 中 交通 事故 2 , 317 件 うち 712 人 横断 歩道 上 事故 遭う 死傷 する おる もはや 横断 歩道 安全 言える なる いる の ある 横断 歩道 果たす 役割 見詰める 直す 歩行 者 守り抜く 対策 急務 考える。
summary12
そこ 伺う 横断 歩行 者 優先 意識 高める ゼブラ ストップ 作戦 よう 周知 する いる の。

要約例 中台さん

元の発言が2000文字A4 2ページ程度だったものを1000文字程度に要約されています

summarize('./00_poly/chiba2018/','◯',20,'中台','良男',12,debugLevel=1)  

------------------------------------------------------------------
中台 良男 さんの議事録発言サマリー ./00_poly/chiba2018/
Sum_Basic============================
# もともとの発言が短かったので、basicでもそこそこ良い要約結果になっている
summary1
主 要望 事項 順次 申し上げる。
summary2
1 県 税 収入 未済 額 県 税 収入 未済 額 税 負担 公平 性 観点 削減 向ける 取り組み 一層 充実 強化 する。
summary3
2 鉄道 施設 耐震 対策 事業 補助 鉄道 施設 耐震 対策 事業 補助 今後 想定 する れる 南海 トラフ 地震 首都 直下 地震 規模 地震 備える 地震 時 鉄道 ネットワーク 確保 多く 鉄道 利用 者 安全 確保 する ため 重要 もの こと しっかり 取り組む。
summary4
4 福祉 タクシー 導入 促進 高齢 者 障害 者 海外 来訪 者 円滑 移動 できる 交通 手段 普及 する せる こと 非常 重要 こと 今後 計画 的 福祉 タクシー 導入 促進 図る れる よう 取り組む。
summary5
5 浄化槽 法定 検査 受検 率 向上 浄化槽 法定 検査 受検 率 さまざま 取り組み 向上 する ある いまだ 全国 的 下位 状況 ある こと 受検 率 向上 取り組む。
summary6
7 農業 利用 する 機械 整備 担い手 増加 耕作 放棄 地 減少 ため 農業 者 現場 使用 する 安全 作業 効率 向上 資する 機械 助成 対象 する。
summary7
9 公共 事業 施工 時期 平準 化 公共 事業 施工 時期 平準 化 人材 資材 効果 的 活用 ほか 地域 支える 建設 業 安定 雇用 担い手 中長期 的 育成 資する もの こと 公共 工事 発注 債務 負担 行為 早期 繰越 設定 施工 時期 平準 化 積極 的 取り組む。
summary8
11 横断 歩道 補修 横断 歩行 者 被害 者 なる 交通 事故 防止 する ため 横断 歩道 鮮明 標示 する れる いる 必要 ある こと 引き続き 点検 補修 必要 する 横断 歩道 把握 努める 増額 なる 予算 有効 活用 する 横断 歩道 適切 維持 管理 努める。
summary9
12 上水道 事業 基幹 管 路 耐震 化 上水道 安定 給水 ため 基幹 管 路 耐震 化 進める こと 大変 重要 こと 一層 計画 的 進める。
summary10
14 千葉 県立 病院 改革 プラン 病院 局 平成 26 年度 以降 赤字 続く 厳しい 経営 状況 こと 早急 経営 改善 必要 不可欠 千葉 県立 病院 改革 プラン 基づく 取り組み 着実 実行 する 経営 効率 化 努める 早期 収支 改善 図る。
summary11
以上 とおり 特別 委員 会 要望 事項 付す 平成 29 年度 千葉 県 一般 会計 特別 会計 歳入 歳出 決算 賛成 多数 もつ それぞれ 決算 書 とおり これ 認定 する もの 決定 いたす。
summary12
以上 決算 審査 特別 委員 会 報告 終わる 拍手。

LexRank============================
# かなりポイントを絞ったよい要約になっている
summary1
決算 審査 特別 委員 会 委員 長 中台 良男 君 特別 委員 会 9 月 定例 県議会 設置 する れる 同時に 平成 29 年度 千葉 県 一般 会計 特別 会計 歳入 歳出 決算 認定 付託 受ける 閉会 中 継続 審査 議決 得る 8 回 委員 会 開催 する 執行 当局 説明 聴取 する 厳正 審査 行う まいる 結果 会計 計数 監査 委員 監査 意見 書 とおり 過誤 ない もの 認める られる。
summary2
1 県 税 収入 未済 額 県 税 収入 未済 額 税 負担 公平 性 観点 削減 向ける 取り組み 一層 充実 強化 する。
summary3
2 鉄道 施設 耐震 対策 事業 補助 鉄道 施設 耐震 対策 事業 補助 今後 想定 する れる 南海 トラフ 地震 首都 直下 地震 規模 地震 備える 地震 時 鉄道 ネットワーク 確保 多く 鉄道 利用 者 安全 確保 する ため 重要 もの こと しっかり 取り組む。
summary4
3 千葉 県 地域 防災 計画 修正 地域 防災 計画 県民 生命 財産 守る ため 重要 計画 こと 国 講じる 対策 速やか 反映 する せる 引き続き 実効 性 ある 計画 づくり 取り組む。
summary5
4 福祉 タクシー 導入 促進 高齢 者 障害 者 海外 来訪 者 円滑 移動 できる 交通 手段 普及 する せる こと 非常 重要 こと 今後 計画 的 福祉 タクシー 導入 促進 図る れる よう 取り組む。
summary6
5 浄化槽 法定 検査 受検 率 向上 浄化槽 法定 検査 受検 率 さまざま 取り組み 向上 する ある いまだ 全国 的 下位 状況 ある こと 受検 率 向上 取り組む。
summary7
6 千葉 ポテンシャル 生かす 地域 産業 活性 化 事業 事業 軌道 乗せる いく ため 商品 開発 販路 開拓 試行錯誤 繰り返す 多く 時間 要する こと 地域 活性 化 図る する 事業 者 地道 努力 県 きめ細かい 支援 する こと 地域 産業 一層 振興 努める。
summary8
7 農業 利用 する 機械 整備 担い手 増加 耕作 放棄 地 減少 ため 農業 者 現場 使用 する 安全 作業 効率 向上 資する 機械 助成 対象 する。
summary9
8 アワビ 増産 総合 対策 事業 地域 アワビ 大変 重要 水産 資源 こと 種苗 放流 継続 する 整備 する れる 輪 採る 漁場 最大限 有効 活用 する れる よう 技術 的 指導 初め 利用 方法 踏み込む 積極 的 支援 行う。
summary10
9 公共 事業 施工 時期 平準 化 公共 事業 施工 時期 平準 化 人材 資材 効果 的 活用 ほか 地域 支える 建設 業 安定 雇用 担い手 中長期 的 育成 資する もの こと 公共 工事 発注 債務 負担 行為 早期 繰越 設定 施工 時期 平準 化 積極 的 取り組む。
summary11
10 県立 学校 職員 室 等 空調 整備 生徒 安全 教職員 良好 執務 環境 確保 する ため 早急 空調 整備 する。
summary12
以上 とおり 特別 委員 会 要望 事項 付す 平成 29 年度 千葉 県 一般 会計 特別 会計 歳入 歳出 決算 賛成 多数 もつ それぞれ 決算 書 とおり これ 認定 する もの 決定 いたす。

Lsa==============================
# 最後のsummary12が意味が少ないのが残念
summary1
決算 審査 特別 委員 会 委員 長 中台 良男 君 特別 委員 会 9 月 定例 県議会 設置 する れる 同時に 平成 29 年度 千葉 県 一般 会計 特別 会計 歳入 歳出 決算 認定 付託 受ける 閉会 中 継続 審査 議決 得る 8 回 委員 会 開催 する 執行 当局 説明 聴取 する 厳正 審査 行う まいる 結果 会計 計数 監査 委員 監査 意見 書 とおり 過誤 ない もの 認める られる。
summary2
予算 執行 伴う 政策 効果 経済 性 外郭 団体 適正 効率 的 運営 管理 経営 安定 性 観点 審査 過程 当局 説明 求める 今後 予算 執行 一層 検討 加える 改善 是正 する もの 要望 する 事項 少ない ある それら 諸点 当局 適切 措置 期待 いたす。
summary3
4 福祉 タクシー 導入 促進 高齢 者 障害 者 海外 来訪 者 円滑 移動 できる 交通 手段 普及 する せる こと 非常 重要 こと 今後 計画 的 福祉 タクシー 導入 促進 図る れる よう 取り組む。
summary4
6 千葉 ポテンシャル 生かす 地域 産業 活性 化 事業 事業 軌道 乗せる いく ため 商品 開発 販路 開拓 試行錯誤 繰り返す 多く 時間 要する こと 地域 活性 化 図る する 事業 者 地道 努力 県 きめ細かい 支援 する こと 地域 産業 一層 振興 努める。
summary5
8 アワビ 増産 総合 対策 事業 地域 アワビ 大変 重要 水産 資源 こと 種苗 放流 継続 する 整備 する れる 輪 採る 漁場 最大限 有効 活用 する れる よう 技術 的 指導 初め 利用 方法 踏み込む 積極 的 支援 行う。
summary6
9 公共 事業 施工 時期 平準 化 公共 事業 施工 時期 平準 化 人材 資材 効果 的 活用 ほか 地域 支える 建設 業 安定 雇用 担い手 中長期 的 育成 資する もの こと 公共 工事 発注 債務 負担 行為 早期 繰越 設定 施工 時期 平準 化 積極 的 取り組む。
summary7
10 県立 学校 職員 室 等 空調 整備 生徒 安全 教職員 良好 執務 環境 確保 する ため 早急 空調 整備 する。
summary8
12 上水道 事業 基幹 管 路 耐震 化 上水道 安定 給水 ため 基幹 管 路 耐震 化 進める こと 大変 重要 こと 一層 計画 的 進める。
summary9
13 造成 土地 管理 事業 収入 確保 水道局 統合 後 独立 する 特別 会計 運営 する こと なる 造成 土地 管理 事業 将来 支出 見通し 留意 する 保有 土地 処分 迅速 着実 進める 収入 確保 図る いく。
summary10
14 千葉 県立 病院 改革 プラン 病院 局 平成 26 年度 以降 赤字 続く 厳しい 経営 状況 こと 早急 経営 改善 必要 不可欠 千葉 県立 病院 改革 プラン 基づく 取り組み 着実 実行 する 経営 効率 化 努める 早期 収支 改善 図る。
summary11
以上 とおり 特別 委員 会 要望 事項 付す 平成 29 年度 千葉 県 一般 会計 特別 会計 歳入 歳出 決算 賛成 多数 もつ それぞれ 決算 書 とおり これ 認定 する もの 決定 いたす。
summary12
以上 決算 審査 特別 委員 会 報告 終わる 拍手。

気づきと課題

上記アルゴリズムは事前学習無しで、NotePCで数十秒で実行できました。要約のレベルはまちまちですが、LexRank, LSAを組み合わせて適度な長さの方を採用するなどすれば議員さんの実体の行動を短い時間で多くの人が把握するという実用に耐えるのではと感じました。

千葉県議会議員の名簿 数十人分を一気に要約にかけてみると、2018年度は一回も発言していない人が結構います。多分本議会では時間の関係で質問、発言は持ち回りになっているのだと予想します。多分実質的な議論は委員会で行われているのだとおもいます。 であれば委員会の議事録もようやく対象に加えて、時系列でならべればその議員の発言の一貫性も簡易にチェックできるのではないかと考えました。さっそくwgetでDLをしかけてみましたが、なぜかすぐ終わってしまいDLしてくれません。 よくよくDLされたものをみると委員会の場合は、TopページがJavascriptでリンクを出力する形になっておりwgetはjavascriptの内部まではみてくれないのでDLされないという課題でした。。 こちらはcrawlerはもう少しカスタマイズしたものを自作する必要がありそうということが分かりました。

if( "平成29年_環境生活警察常任委員会(第1号)  名簿" != "" ){
	// 文書名表示
	document.write( '<div class="title">' );
	document.write( '<a href="/pbgikai/dsweb.exe/documentframe!1!guest02!!5000!1!1!13,-1,13!3078!288582!13,-1,13!3078!288582!14,0,14!20!2875!260846!!10?Template=DocOneFrame">平成29年_環境生活警察常任委員会(第1号)  名簿<\/a>' );
	document.write( '&nbsp;<span class="date">2017.10.04<\/span>' );
	document.write( '<\/div>' );
}else{

一番時間がかかるのが、議事録のDLなので 今後公開していくときはサーバーを構築してそこにWebPageから議事録のリンクをはりつけて、議員の一覧を渡せば要約したもの、発言回数、発言の一貫性スコア などをだせるところまでは行けそうだなという感触をもちました。また、議事録にない新人さんをどうするのかという課題がありますので 議事録だけでないSNSやブログの内容も集約対象に混ぜれば解決できるかなとおもいますが信頼性をどう担保するか等は要検討です。

息子と選挙にいってきました

最後は手作業もかなり混じりましたが、委員会の議事録もDLして要約したものを息子にみせながら 各議員さんの実際に発言したことを参考にしてもらうことができました。 千葉県の課題と議員さんについて少しでも考えるきっかけになってくれたらと思います。 

この記事が気に入ったらサポートをしてみませんか?