見出し画像

【Python】自動文書作成の研究メモ「太宰治はいったいどんな作家なのだろうか?」

実験中。

import torch
from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained("rinna/japanese-gpt-1b")
model = AutoModelForCausalLM.from_pretrained("rinna/japanese-gpt-1b")
text = "太宰治はいったいどんな作家なのだろうか?"
token_ids = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")

太宰治はいったいどんな作家なのだろうか?
僕にとっては、ミステリーやファンタジー、ホラーでもSFでもなく、ただ単純に小説を書ける日本を代表する作家という位置づけだった。
彼の作品は好きか嫌いかの好き嫌いがはっきり別れていたし、作家も作品も多すぎて作家・作品比較などめんどくさくて無理。
でも、作家自身やその作品について書かれた文章は好きだ。
彼の書く文章はいくつもあった小説群から切り離すことができないので、僕なりにその一部の良さを残し、読者の方々と作家の間を繋げるためにこの記事を書くことにした。</s>

手で修正

太宰治はいったいどんな作家なのだろうか?
僕にとっては、ミステリーやファンタジー、ホラーでもSFでもなく、ただ単純に小説を書ける日本を代表する作家という位置づけだった。
彼の作品は好き嫌いがはっきり別れていたし、作品も多すぎて作家・作品比較などめんどくさくて無理。
でも、作家自身やその作品について書かれた文章は好きだ。
彼の書く文章は「文学」から切り離すことができないので、僕なりにその一部の良さを残し、読者の方々と作家の間を繋げるためにこの記事を書くことにした。</s>

1000文字くらいを自動で書かせてみる

太宰治はいったいどんな作家なのだろうか?
太宰治の没後「未完」であったのは太宰の作品にとどまらず、そうではないかに思われているが、そこを正確に答えた者はいない。
「未完」なので、太宰の「未完」は“不死のもの”として、「未完」でもある、不死で“完結もの”でないわけはないのだ。
ところが、「完本」の太宰の作品を探すのに「未完」の「未完」は実に良い印象なのである。
何よりも「未完」ではあるが、多くの作家が自信を持って発表した優れた文章を読み返し、涙ながらに原稿用紙に目を走らせる。
しかし、太宰の「未完」という作品はそれが太宰の“完本”であるということを世間で理解してもらおうとしたものではなかったのである。
太宰のこの小説は単なる「未発表の作品」ではなく、多くの人々の話題になっている作品であるのに、世間一般の人々に理解してもらうような気運はなかったのだ。
つまり「完本」ではなかったのである。
だが、このように世間の理解を得られなかったのは、彼自身を“完本”の作家として評価していなかったからである。
そしてその、彼の「未完」という作品を世に知られ、評価されることを極端に恐れていたのである。
いよいよ、いよいよ、いよいよ、本格的に”未完”の「未完」も世に知られざる作家の独壇場になってきたわけであるが、彼もまた、世間の理解を得られなかったのである。
ただし、彼の作品によって、この「未完」という文学作品を誰が気に入ったのか、その、そのあたりは全くわからない。
仮にそうなったとしても、事実は知ることはありえないのである。
だから、「未完」はあくまでも「完結作品」であって、この太宰作品の“完結”は太宰の“未完”なのだ。
つまり、彼にとっての“完結”とは、太宰が彼自身の生涯最後の長編小説を上梓した、それが、結果的には「完結」の「未完」であったということのようである。
そんな「未完」の太宰は、この“完本”の著者であるのである。

Endnote

長文を書かせると、精度の低さが目立つ。
が、ファインチューニングの実験としては、裏で文書を学習させた結果が出力できているので良しとします。


いつもお読みいただき、ありがとうございます。 書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。