見出し画像

日経社説#14 Scaleに少し取り組んでみます

昨日も、またその日の日経社説を図にするべく、まずは主語のMarkingから始めたのですが、これについてはどこまで自動化できるのかが気になり、そこに時間をとってみることにしました。

その結果、機械的に認識できる主語と、人間にとってわかりやすい主語には隔たりがあるように感じ、なかなか一筋縄ではいかないことがわかりました。サンプルとして3,4つの文章を試したところ、それらに全く類似性が見当たらなかったのです。それぞれが異なったパターンを持っており、単純ではありませんでした。

その結果をうけて、もう少し重点的に調べる必要性を感じたため、もう2,3日その調査を続けたいと思います。

なお、係り受けの抽出に使わせていただいたのは、こちらのツールです。
https://github.com/KoichiYasuoka/UniDic2UD


この記事が気に入ったらサポートをしてみませんか?