WordNetの力で僕のボキャ貧文章を神文章に昇華させたい②

 書いていた原稿がひと段落して、ひとまずタスクが無くなりました。
 脱稿、気持ちいい。

 さて、前回はWordNetを使って文章を類語に変換してうんたらかんたらってやってみたんですが、使っているデータベースに英単語が含まれていて、上手くいきませんでした。
 一応、日本語だけのデータベースもあることにはあるのですが、Pythonの標準ライブラリであるsqlite3が使えるのは和洋折衷(使い方が違う)のデータベースだけっぽいんですよね……sqlite3を使えば簡単に利用できることもあって、できることならこのまま使いたい。
 でも単語が日本語かどうかの判定って実は難しく……いろいろ試行錯誤していたんですが、なかなか苦戦していました。
 そんな中、そもそもWordNetのデータベースがどんな風に構成されているのかを知らずに作れるわけがないだろうと思い、調べたらすぐに解決策が出てきました。
 カラムに"lang"の項目が…………どうしてもっと早く気付けなかった……
 あとはデータベースからデータを取得する際に実行されるSQLの命令を弄って、言語のフィルターかけてあげればオッケー。
 これで勝った。

 なんだか上手くいきそうだったので、実行してみました。
 今回引っ張り出してきたのは今現在僕が書いているSSのものです。助平なやつになる予定なので、ぜひともエロティックに、セクシーに書き換えてもらいたいものです。

<書き換え前>
 薄着で同じ布団にもぐったのは、そういうつもりもあったから。
 背中から伝わってくる彰人の体温に、髪の毛を揺らす細い空気の流れ、シャンプーの香り。そのどれもが、いとも容易く私の心臓を揺らした。
 これが緊張なのか、昂揚なのか、はたまた全く別の感情なのか、今の私には分からない。
<書き換え後>
 薄着で同じ布団にもぐったのは、そういうつもりもあったから。
 後押しから伝わってくる彰人格者の気温に、髪筋を揺らす細いたたずまいの流れ、シャンプーの芳香。そのどれもが、いとも容易く私の核を揺らした。
 これが引締めるなのか、高めるなのか、はたまた全く別々のエモーションなのか、丁度の私には分からない。

 おかしいな…………彰人が彰人格者になってる……
 固有名詞が判定できていないようです。こればかりは仕方ない……

 にしても、全体的に変ですね。
 髢とか知らない言葉があったり……リアとか車にしか使わんのよ。

 ただ、髪の毛が髪筋に書き変わっていたり、香りが芳香に書き変わっていたり、成功しているものもわずかながらにありました。
 こういう書き換えばかりできればいいんですが……ここから先は正直もうどうしようもないので(諦め)、類語の提案ができるような形にしようかと思っています。
 言葉には多義性があって、今はそれを無視した結果上みたいな感じになってしまっています。空気がたたずまいになってたり。
 平文から言葉がどの意味で使われているのか判定するのは無理なので(技術的に)そのあたりはユーザにゆだねてしまおうと思います。

 いよいよ類語辞典使うのと変わらなくなってきているけど、僕はまだあきらめていません。

 ありがとうございました。

  


この記事が気に入ったらサポートをしてみませんか?