![見出し画像](https://assets.st-note.com/production/uploads/images/12419210/rectangle_large_type_2_b7236adb1eaceff4c0767bde3f6a667e.jpeg?width=800)
多言語テキストマイニングで過去のテキスト内の「殺された声」の封印を解ける?かもしれない話
複数の外国語に興味のある人こそデータ分析手法のひとつテキストマイニングにチャレンジしてほしいという記事を以前に書きましたが、その続きで発見したことです。
ここ最近、私なりに、フランス語やイタリア語の古典作品をデータ解析ソフトにいれて遊んでみていたのですが、
かたっぱしからやっていても、存外、面白い発見というのはない。
と思いきや、
ネットで無料で手に入る昔日の史料をどんどん遡っていき、有名な作家の著作や有名な政治家の演説などではなく、市井のマイナーな評論家や作家の手記や手紙なんかをやってみると、がぜん、面白くなってきました。
特にナチス時代のドイツのユダヤ知識人が書いたエッセイや論文がダントツに興味深い。
まだ公開できるほどにはかたまっていないのですが、「エデンの園」とか「十戒の聖櫃」とか「バベルの建設」とかいった、ユダヤ人どうしならわかるキーワードや比喩をちりばめて、うまく「生粋のドイツ人には読みにくい」文章にしている気配がある。
これが意図的なものなのか、単純に当時の流行だったのかは不明ながら。
という次第で、本日の仮説、過去のテキストに対してデータ分析を仕掛けるなら、マイナーな著作家の文章や名もなき市井の手紙なんかを集めてやったほうが、現代に訴えかけてくる何かが見えてくるのではないでしょうか。
ざっと、
・ナチス時代のドイツ
・スターリン時代のロシア
・もっとさかのぼれば異端審問時代のスペインの女性たち
・さらにさかのぼれば初期ローマ帝国下のキリスト教徒
などに対象を絞っていくと、「時の権力に弾圧されていたために、思うことを自由に書けなかった人たちが、そっとテキストの中にしのびこませていた本音」などが、今の技術で取り出せるようなことがあるかもしれません。
うーむ、ちょっと夢物語かな。
でも、有名な作家先生の著作をデータ分析して「さすがは明文家の先生、形容詞の使い方にこんな工夫をしてらっしゃるのか」とうなずいて終わる分析よりも、
名もない人々が日記にそっと忍び込ませていた、仲間うちにしか通じない隠喩を見つけて「これはじつは比喩で、スターリンに対する批判を仲間に目配せしているのだ!」という衝撃に打たれるほうが、はるかに意義深いテーマではないでしょうか。
とうに殺されて過去のテキストの中に封印されているものを、現代のテクノロジーで「救済」する。夢物語だとしても、どこまで可能なのか、個人的に追いかけたいテーマです!
などと思って、昨夜から以下のサイトより第一次世界大戦中のドイツの著作『Über Sprache überhaupt und über die Sprache des Menschen』を取り出してテスト的に解析中。
「人間」「言語」「精神」という3キーワードが複雑に絡み合っているテキストであることが可視化できて、さっそく興味津々。
だがこういったテーマを今後、追うとなると、ドイツ語もしっかり勉強しなくちゃ。。。
まったく、多言語テキスト分析の冒険はいつまでも続いて終わりというものがなさそうな世界ですね。もちろん、良い意味で!
子供の時の私を夜な夜な悩ませてくれた、、、しかし、今は大事な「自分の精神世界の仲間達」となった、夢日記の登場キャラクター達と一緒に、日々、文章の腕、イラストの腕を磨いていきます!ちょっと特異な気質を持ってるらしい私の人生経験が、誰かの人生の励みや参考になれば嬉しいです!