見出し画像

自分用の校正ツールを作った話

成果物「俺俺校正くんα」はこちらです。

俺俺校正くんαを使った結果

きっかけ

4つほどあるんですが

  1. 自分のnoteなどに投稿する文章が酷すぎるから

  2. AI(chatGPTとか)noteのAI機能でも自分の思うような校正をサクっとしてくれなかった

  3. 校正ツールが手軽(値段とか含めて)じゃないから

  4. こんな私だけど意外と「文章のチェックしてください」的な依頼がくる

2について補足です。chatGPTの校正は正しい(?)文章を書く上では非常に有益だと思います。言い回しや漢字、送り仮名などの訂正もやってくれるのですが文章に個性がなくなる気がしています。
ある程度許容される(?)独特な言い回しなどを学習させればいいのでしょうが、私のプロンプトの問題もあり指摘してほしい部分が違っているというのが私の実情でした。(サンプルを後述しています。)

懺悔

社会人なりたての頃(その頃は金髪でした)、業務の一環として1クール13話のアニメの内容を毎週1話ずつあらすじにして公式サイトにアップするというような仕事をやったことがあります。(別に文章を書くのはこの仕事以外でもやりましたが、本当になりたてのころの話)
で、当時の先輩の1人が元ライターさんだったので色々チェックしてもらったのですが、やっぱり本業の方の書き方とかチェックって凄くて「とてもじゃないけど真似できないなぁ」と思ったりしました。

そして現在。

文章でさえまともに書けない人がUI/UXを語るなかれ…

私の文章を読んだことある方ならば「お分かりの通り」ですが、前述の『社会人を始めたばかりの頃の経験』は夢の中の出来事だったのかのように酷い文章を量産しています。 (その間に本の執筆もしたことがあった気もしますが多分気のせい…)

まぁ、個人の面白さを追求してるので「その工程や結果をまとめる文章なんてのは副次的な役割でしかないなぁ」と諦めている感はあるんですけど… とは言え、仕事で会社メンバーの文章を他人目線でチェックすることもあり、その度に「申し訳ないなぁ」といつも思うわけです。

同時に「自分用の校正ツールがあればなぁ」となんとなく頭に浮かできました。

とりあえずAI(ChatGPT)にお願いしてみよう

ちょっと前はweb3.0とか言っていたのに…

時代はChatGPTらしいです。
かく言う私もChatGPTにはお世話になっていて「いい時代になってきたなぁ」と思っています。

ということで、自分の満たせる修正をしてくれるのかテストしてみました。
サンプルのテキストは以下です。

まぁ、この話は自分が社会人になりたての話のことなんですが、当時金髪で仕事をしていたんですがまぁよく先輩に注意されていました。。。
まぁ、そんな時代もあったもののあっという間に時間は過ぎてしまったのですが当時の記憶を辿ってみると懐かしい記憶が蘇ります。

校正用のサンプルテキスト

私の癖である「まぁ」と「ですが」を短い文章に無理やりいれています。
結果は以下のようになりました。


まぁ、この話は自分が社会人になりたての頃のことなんですが、当時金髪で仕事をしていたんです。まぁよく先輩に注意されていました。そんな時代もあったものの、あっという間に時間は過ぎてしまいましたが、当時の記憶を辿ってみると懐かしい思い出が蘇ります。

以下の文章から誤字・脱字、タイプミス、文法ミスを見つけてください

「ですが」の重複は消えていますが「時間は〜たが」の部分も変更してほしいのとそもそも「まぁ」が消えてない…

こういう時は、AIが悪いわけじゃなく、プロンプトを入れている人間の指示内容が悪いので「重複表現を避ける」お願いもしてみます。


以下の文章から誤字・脱字、タイプミス、文法ミスを見つけて重複表現を避けてください

とお願いして、再度挑戦。

まあ、この話は自分が社会人になりたての頃のことなんですが、当時金髪で仕事をしていたんです。よく先輩に注意されていました。そんな時代もあったものの、あっという間に時間は過ぎてしまい、当時の記憶を辿ってみると懐かしい思い出が蘇ります。

以下の文章から誤字・脱字、タイプミス、文法ミスを見つけて重複表現を避けてください

いい感じな気がしますが「まぁ」が「まあ」に修正されているw


というか、自分だったら『。。。』を3点リーダーするなぁ」とか「改行消さないよなぁ」とか色々思うのですが、何より自分の文体を考えると最初の「まぁ」を消して「まぁ、よく先輩に怒られていました」とした方が『シックリくるなぁ』とか贅沢な思考になってきます。

で思うわけですね、「もう自分用のを作ればいいじゃん!」と。

はい、ということで一旦「自分用」というのと哲学?します。

自分用の校正ツールとは?

ある程度文章を書いた経験のある方なら分かると思いますが、自分の文章って『癖』が出ます。 (プログラミングも一緒ですけど)

私の場合「まぁ」「ですが」「など」「ほど」「ので」を多用するんですね。 (しかも、文章中の割と近いところで)

もちろん、「漢字の変換の間違い」「送り仮名の間違い」「鉤括弧の閉じ忘れがある」とかも大事なんですけど、前述した癖の方が自分は嫌悪感があります。

ということで、以下の仕様が入ったツールを作ります。

公開前の文章をそもそもサーバーに送りたくない
・連続する句点が「…」じゃなかったら注意してくれる
・近い文節に同じ表現があったら注意してくれる
・括弧の終わりに続いて句読点があったら注意してくれる
・同じような感動詞が近い場所で連続していたら注意してくれる
・直前に会話やらしき文章ある可能性があったら注意してくれる
・助詞が2連続していて冗長な言い回しになっていたら注意してくれる
・近い文節に同じ助詞があったら注意してくれる

尚、ChatGPTのAPI使った結果と比較とかすると楽しいが結局プロンプトのカスタマイズに時間を割きそうなのとAPIを使うという点で今回は割愛。

ということで、作ろう

https://www.atilika.com/ja/kuromoji/ TOPページより

以前に形態素解析で有名なKuromojiが流行した時、自分の出身地の方言にするものを作ったことがあったんですが当時のkuromojiってJAVA版しかなくて個人的にちょっと使いづらかったんですよね。 (当時は面倒だったのでJRubyから呼び出してました)

で、何年か前kuromojiがJSに移植されたのも目にしてたので、自分が望むのは「間違いなくできるだろうなぁ」と思っていました。 (少なくとも自分のコードが間違わなければできるはずだ!)

名付けて「俺俺校正くん」です。
JSのObjectのloop文に四苦八苦すること3時間でようやく形になりました。

そして先ほどのサンプルを入れた結果が当記事の一番上にあるようなものです。

作った本人のダメなところをちゃんと指摘してくれています。

及第点のはできた

頑張れば、他にも前述した鉤括弧の閉じ忘れとか、口語体を修正するとか色々あると思いますし、パラメーターも動的に変更できる方がいいと思いますが、自分専用のα版として適当なfaviconの作成とか入れても半日もかからずできたので及第点です。
開発時間も「自分の文章の癖をみつけるか?」に大半を使いました。

というか実際に修正機能は入ってないので「校正というより文法チェッカー(Lint)じゃん」というのと、やっぱり「ChatGPTにちゃんとしたプロンプト投げるようにした方が絶対いいだろ!」というオチでした。

ちなみに、この文章ももちろん俺俺校正ツールを使って修正しました。


サポートしていただいたら娘・息子に何かプレゼントしようと思います! 多分、ミルクorトミカになると思います。 面倒な方は、LINEスタンプを購入していただいても大丈夫です。 https://store.line.me/stickershop/author/261022/ja