日経社説#14 Scaleに少し取り組んでみます
昨日も、またその日の日経社説を図にするべく、まずは主語のMarkingから始めたのですが、これについてはどこまで自動化できるのかが気になり、そこに時間をとってみることにしました。
その結果、機械的に認識できる主語と、人間にとってわかりやすい主語には隔たりがあるように感じ、なかなか一筋縄ではいかないことがわかりました。サンプルとして3,4つの文章を試したところ、それらに全く類似性が見当たらなかったのです。それぞれが異なったパターンを持っており、単純ではありませんでした。
その結果をうけて、もう少し重点的に調べる必要性を感じたため、もう2,3日その調査を続けたいと思います。
なお、係り受けの抽出に使わせていただいたのは、こちらのツールです。
https://github.com/KoichiYasuoka/UniDic2UD
この記事が気に入ったらサポートをしてみませんか?