見出し画像

「ことのはたんご」辞書更新と透明性向上

はじめに

 本投稿では単語推理ゲームである「ことのはたんご」に関する「たんご辞書」の更新および「ことのは辞書」の詳細に関して記述している。

 「ことのはたんご」をしらない方はこちらもしくはAUTOMATON様の記事から確認して下さい。

 前半に辞書更新に関して述べて、後半に本アプリに対する透明化に関して述べている。

結論

 出題単語辞書を概ね一般的な単語を出題するするように変更。(約1500単語を削除)

 たんご辞書・ことのは辞書の内容及びリリース後の追加単語に関するリンクを記載。

 以下論文口調の見にくい文章が続いているため、注意していただきたい。

なぜ辞書更新か

 今日(2022/1/30)「ことのはたんご」をプレイした皆さんはお気づきだと思うが、出題された単語が一般的ではない。ここにその答えは出さないが、分類語彙表の出題辞書を見る限りでも「氷川様」「るりびたき」「男文字」「アダージョ」などその用語を知っていて使っている人がいるのだろうが、一般的ではない単語が多く存在する。これは有名ではない植物・動物だったり専門的な単語だったりするからだ。

 もちろん「ことのはたんご」の遊び方的には文字を探すことが出来れば当てることは可能である。私も知らない単語を当てるのも面白いと思いながら1/30日のお題を解いた。しかし、当てた際にもやもやが残る感覚がある。「あーこれだったのか」といった喜びの体験がなく、「なんだそれ?」といった疑問が浮かぶのが先だろう。

 深く考えすぎな面もあるとは思うが、全く知らない単語が続出することは作者として避けたいと思っているため、辞書更新を行おうと決めた。

難易度調整

 辞書更新には軽い難易度調整の側面も存在する。「ことのはたんご」は他のWordle系ゲームの中でほぼトップに近い難易度をしている。これはWordleを日本語化する際に「出題文字数の変更を行っていない」「しりとりのように小文字・濁点の区別をなくすことをしていない」ことに起因している。
 もちろん解き方次第で頑張ればなんとか解けるといった楽しみ方も存在するが、そのように遊ぶには試行回数10回は少なく総当たりで当てに行くことも厳しいように思える。

 一つ目の「文字数の変更を行っていない」に関しては、本アプリを作る都合上、Wordleのまねごとをすることになる。ルールをコピーすることは法律的には問題無いが個人的には少し後ろめたい感覚がある。そのため、アプリケーション作成において1からコードを描きUI等もなるべく似ているようにしたが、キーボード入力欄を用意するなど独自性を出したわけだ。
 日本語において「4文字」に変更した方が難易度の面から適切であることはコード作成・テスト時点で気が付いていた。しかし私としては原作をリスペクトしたい気持ちからどうしても「5文字」にしたいといった気持ちが拭えなかったためこのような結果に落ち着いている。

 二つ目の「小文字・濁点の区別をしている」点に関しては難易度調整として有用なのは解るが、日本語の本質が変わる気がしてなんとなく嫌だったからである。もちろんしりとりなどではそのような面から良く区別をなくすことが行われているわけだが、「だ」と「た」は別の文字であるといった感覚が個人的には強い。
 例に挙げると「ダッキュウ」と入力した際に正解のたんごが「タッキュウ」だったとしても正解になるわけだ。

 以上より、根本的なシステムに対する調整を行う予定はないため、せめて出題たんごは多少の調整が必要なのではと考えた次第である。

 前述のnoteでは「選出単語が悪いのは乱数がわるい」と記載したわけだが、そもそも悪い単語が沢山ある場合では乱数も避けに避けきれずピックアップしてしまうことが多々あるわけだ。あまり乱数に責任を押しつけるのも悪いと思ったため作者側でまともな辞書に変更するといった次第である。

出題単語変更点

 「ことのはたんご」1~9回においては国立国語研究所(2004)『分類語彙表増補改訂版データベース』(ver.1.0)における類が体である(名詞)ものの中から5文字の単語を抽出し、その単語をランダムで選出すると言った手法をとっている。

 今回の変更では下記の基準を下に、作者が約1万2000単語をフィルタリングし、約1万単語に変更した。これにより、まったくしらない単語の出現率を下げることができたと思う。

 植物名・動物名・料理名・音楽・地学・科学・宗教に関連する用語は一般的な単語に関しては抽出し「氷川様」「クビレズタ」などのような一般的ではない単語を省く。また「醜行」や「教程」「虚飾」「緞帳」などの何かしらの意味を表す単語ではあるが一般的ではない単語に関しては本人の語彙力等に左右され、上記専門用語よりも比較的当てやすい(体感)ため、なるべく採用する方向で定めた。
 機械による線引きではないため、一貫性がなく曖昧な点があることは非常に申し訳ないと思う。また人の手によるフィルタリングなため抜けている箇所があることもご了承いただきたい。

透明性

 本アプリにおいてはなるべくオープンに作成し、様々な議論や検証を行って欲しいと思っているため出題に関する「たんご辞書」と回答の整合性を検証する「ことのは辞書」に関するデータリンクを記載する。なおこの辞書を用いて「ことのはたんご」を解く場合難易度が激下がりするため留意していただきたい
 本アプリは様々なライセンスのもと運営されているため個人の範囲を超える二次利用及び商用利用は禁止する。

たんご辞書

 たんご辞書とは問題となるたんごが記載されている辞書であり、この中のたんごから選ばれて出題される。これらたんご辞書は固有名詞を一般的な単語+外来語+助詞を含まない2単語を組み合わせた単語で構成されるよう、適宜アップデートを行う。
 国立国語研究所(2004)『分類語彙表増補改訂版データベース』(ver.1.0)のデータを利用し、独自の基準を用いてフィルタリングしたもの。後に追記する可能性あり。

 たんご辞書

ことのは辞書
 ことのは辞書とは入力の際に参照する辞書であり、この辞書に含まれている単語を、ことのはたんごに入力することが出来る。また残り候補数推移の際に利用している辞書もこちらである。
 上記、国立国語研究所(2004)『分類語彙表増補改訂版データベース』(ver.1.0)にくわえ国立国語研究所:UniDic「UniDic-cwj_3.1.0」の辞書を用いて作成した。こちらにおいては網羅性を考えフィルタリングは行わず名詞における5文字の全単語を利用している。
 また備考欄にある新規単語登録フォームより送信された単語に関して一定の基準をもとに追加している。フォームからの追加に関しては作者の負担もあるため、やや時間が空くことをご了承いただきたい。
 一定の基準の目安として、人名においてはWikipediaが存在している場合は採用し、ゲーム内のアイテムやキャラクターにおいては特別有名でなければ採用していない。

ファイルサイズが大きく、移動した際に画面が固まる場合が多いです

 ことのは辞書

 フォームより新規追加された単語一覧

おわりに

 ゲームにおいて誰もが満足するものを作るのは難しいと感じた。個人的には難易度の高さが面白いと思っていたが、1日1回スマホでちゃちゃっと遊ぶゲームにそこまでの難しさを求めていないと言った意見も理解出来る。

 ここから先様々なことを考えながらこのゲームの運営を行うため、温かい目で見守っていただけると幸いである。

他note記事

サイト

この記事が気に入ったらサポートをしてみませんか?