【ネタバレ(?)注意】WORDLE jaの最適解チャートを組んでみた

こんにちは。ちゃそです。

WORDLE ja、楽しいですね。

WORDLE jaというのは、あせるねこ(@aseruneko)さんが作成した、海外発祥の英単語当てゲーム「WORDLE」の日本語版です。

本家WORDLE↓

WORDLE ja↓

今回は、このWORDLE jaでなるべく最短で答えを当てるために、どのような単語を試せばよいかを考えてみました。


ゲームのルール


WORDLE jaは、ある日本語5文字の単語を当てるゲームです。

プレイヤーがある5文字の単語を回答すると、その単語の1文字目から5文字目について、

その文字が答えに含まれていない場合 → 白
その文字が答えに含まれているが場所が違う場合 → 黄色
その文字が答えに含まれ、場所も合っている場合 → 緑

のように色がつきます。これをくり返して、答えとなる単語を当てればクリアです。

また、本家WORDLEでは存在しない言葉は入力できませんが、WORDLE jaでは入力可能です。しかし、今回の解析においては、使用されている辞書に存在する言葉のみを入力対象とするレギュレーションを設けました。

なお、答えとなる単語に重複文字が存在する場合の挙動は、本家WORDLEとは異なるようですが、この辺りに深入りすると面倒そうなのでやめておきます。とりあえず、WORDLE jaでは単純に上の規則を一文字ずつ当てはめたものが返ってくるようです(「あーけーど」が答えのときに「ーーーーー」と回答すると「黄緑黄緑黄」が返ってきます)。


方法


今回の解析の考え方はミニマックス法と呼ばれるものです。

簡単に言えば、ある単語を打って、最も候補が絞れなかった場合の候補数を考え、それが一番小さくなるような単語を求めるというものです。

例えば、最初に「あいえんか」と打って「白白白黄白」と返ってくれば、この時点での候補数は494個となります。あるいは、「緑白黄白白」と返ってくれば、この時点で答えは「あたりまえ」に確定します。
しかし、最悪の場合「白白白白白」が返ってきて、1079通りまでしか絞れません。

一方、最初に「あいきょう」と打った場合、最悪の「白白白白白」のときでも840通りまで絞れるので、こちらの方がよいだろう、という考え方です。

このような考え方にしたがって、WORDLE jaでなるべく早く正解にたどり着けるような方法を求めてみました。


結果


さて、これから解析結果を述べますが、これはある意味自分で考えてプレイする楽しさを損なう可能性のある一種のネタバレです。

ですので、ここから先は見たい方のみ見るようにしてください。












それでは、結果を書いていきます。


まずは1手目(最初に入力するべき言葉)です。

あいえんか is better. Worst: 1079 when 00000
あいきょう is better. Worst: 840 when 00000
あいしょう is better. Worst: 824 when 00000
いんしょう is better. Worst: 700 when 00000
いんりょう is better. Worst: 622 when 00000
ういんかー is better. Worst: 605 when 00000
Please try ういんかー

ということで、ういんかーと入力するのが良さそうです。


続いて2手目です。「ういんかー」と入れて返ってきた結果ごとに、次のように打つのが最適になりました。なお、「0」は白、「1」は黄色、「2」は緑を指します。「白黄白白緑」なら「01002」です。


00000 ... next: とりしきる (605)
00001 ... next: とるねーど (78)
00002 ... next: ふりーたー (67)
00010 ... next: かえりみる (116)
00011 ... next: あどばいす (4)
00012 ... next: あてはまる (3)
00020 ... next: くりすたる (28)
00021 ... ans: ふぉーかす
00022 ... next: えすにっく (5)
00100 ... next: せんたくし (220)
00101 ... next: ぼーるぺん (41)
00102 ... next: おくりだす (8)
00110 ... next: じゃくてん (26)
00111 ... ans: かーりんぐ
00112 ... next: あいことば (2)
00120 ... next: じむきょく (10)
00122 ... ans: れんたかー
00200 ... next: きゃくせん (53)
00202 ... next: ぎゃらりー (10)
00210 ... next: あかちゃん (7)
00212 ... ans: かれんだー
00220 ... next: けんしゅつ (6)
01000 ... next: いさましい (185)
01001 ... next: あいことば (2)
01002 ... next: あどばいす (7)
01010 ... next: かがいしゃ (42)
01020 ... next: あたらしい (8)
01100 ... next: いんさいど (45)
01101 ... ans: ぶーいんぐ
01110 ... next: かがくてき (6)
01120 ... next: あかちゃん (3)
01200 ... next: じばいせき (9)
01210 ... next: いやがらせ (5)
01220 ... next: あいしゅう (3)
02000 ... next: あっしゅく (94)
02001 ... next: あたいする (3)
02002 ... next: あいきゅー (3)
02010 ... next: おしつける (16)
02020 ... next: あいだがら (3)
02022 ... ans: さいどかー
02100 ... next: しゃだんき (23)
02110 ... next: あいえんか (3)
02120 ... next: あしがかり (3)
02220 ... ans: いいんかい
10000 ... next: しきじょう (477)
10010 ... next: えきじょう (18)
10020 ... next: しゅりょく (10)
10100 ... next: しきじょう (240)
10110 ... next: よびちしき (9)
10120 ... next: しきちょう (6)
10200 ... next: ときたまご (5)
10210 ... next: あいことば (3)
10212 ... ans: かうんたー
11000 ... next: しきじょう (74)
11010 ... next: あいきょう (3)
11020 ... next: しきちょう (9)
11100 ... next: きょういく (15)
12000 ... next: しきじょう (77)
12002 ... ans: はいうえー
12010 ... next: しきじょう (13)
20000 ... next: あらたまる (31)
20002 ... next: あいえんか (2)
20100 ... next: あいえんか (3)
21000 ... next: あけくれる (6)
22002 ... ans: ういすきー
22100 ... ans: ういにんぐ
22202 ... ans: ういんどー
22222 ... ans: ういんかー


最終的に、すべての場合で正解に至るまで調べてみると、次のようになりました。ちなみに全部で3697行あります。


このチャートに従った場合に必要な試行回数は、全2766単語のうち、

1... 1個     (ここまでで 0.04%) 
2... 13個    (ここまでで 0.47%)
3... 272個   (ここまでで10.30%)
4... 966個   (ここまでで45.23%)
5... 1081個  (ここまでで84.31%)
6... 367個   (ここまでで97.58%)
7... 47個    (ここまでで99.28%)
8... 15個    (ここまでで99.82%)
9... 5個     (ここまでで100%)

となりました。グラフは以下の通り。

画像2

というわけで、約85%の確率で5回以内、約97.5%の確率で6回以内に正答できることがわかりました。

ちなみに、最大である9回が必要な単語は以下の5つです。

ういんかー
    しきじょう  
        あけくれる
            ほりさげる
                せれもにー
                    えいようそ
                        でぃーぜる
                            ねがてぃぶ
                                べんしょう
                                ぶんしょう
                                ねんしょう
        おにいさん
            かけめぐる
                あわだてる
                    げつようひ
                        あさねぼう
                            あたらしい
                                しょうべん
                                しょうしん

(ここで気づいたのですが、今回使用されている元データの時点で「月曜日」の読みが「げつようひ」になってしまっていますね……。これは元データ側のエラーでしょう。)


まとめ


WORDLE も WORDLE ja も面白いのでみんなやりましょう。


使用した辞書データ


日本語学習辞書支援グループ (2015)「日本語教育語彙表 Ver 1.0」

(この辞書データの利用目的は研究・教育に限定されていますが、これも一種の研究ということで、一つ、お許しいただけると幸いです。)

この記事が気に入ったらサポートをしてみませんか?