見出し画像

INAGAKI⊃NAGAKI⊃NAGAI:他の選手の名前を含んでいるかどうか選手権 in Jリーグ

2022年のグランパスには稲垣選手,永木選手,永井選手が在籍していました.試合中,「…?ながきから森下…」とうまく聞き取れずどっちやねん!となることもしばしば.「ながき」と「ながい」の聞き取りもぼんやりしているとよくわからなくなる(画面を見ていれば分かる)ことがそこそこありました.永木選手,永井選手どちらもシーズン中の移籍ということで(私の)混乱に拍車がかかりました.

どうして聞き分けが難しいんだろうか…と考える必要も特になく,単純に音がかぶっているんですよね.INAGAKI⊃NAGAKI⊃NAGAIと,ローマ字表記にすると1文字ずつ減っています.この「1文字(子音か母音かどちらか一つ)」というのがミソで,INAGAKIとNAGAIだと聞き間違えることは多分無いし,「INAGAKIはNAGAIを含んでいる!」とも気づかなかったように思います.


「ローマ字表記で包含関係にあるJリーガーをたどった時,最長の包含関係はどれか?」

はい.ここで気になってしまいました.上記のINAGAKI⊃NAGAKI⊃NAGAIは「3」と定義します.包含関係は取り除いた文字以外の順序が保たれている場合のみとします.また,INAGAKI⊃NAGAIも成り立ってしまいますが間に1名でも挟まっている場合はこの包含関係を無視することとしました.

同じ時期に同一チームとか同じ試合に出ているとかだとデータ処理が面倒なので,チームも時空間を超越して処理します.

元データはいつもお馴染み公式サイト.

ここから全選手の名前を抽出します.アルファベット表記の大文字を取り出し,2単語以上の場合はどうすっかなー,とか考えながらなんやかんややりました.大文字2単語以上含む場合は最初の単語にしたんですが,それで一部変な感じのところがあります(結果に出てしまっています.後述).が,この問題がそもそも変なので変な感じで何が悪いのかという気もしますので深追いはしません.
(作ってから3か月以上経っているので詳細を覚えていないとは言わないですよ…Jリーグ終わったけどワールドカップ始まるから,小ネタはそのあとに書こうかなと思っていたら12月も多忙と体調不良で書けなかったのは事実ですが)

最終的に,同じ表記を統合すると名前は3486通り.

お暇な方はここで読むのをいったん止めて(そのうち戻ってきてください),最長経路を人力探索してみてください.


「ローマ字表記で包含関係(順序関係あり)にあるJリーガーをたどった時,最長の包含関係」

結果発表です.最長は「7」で,2組見つかりました.そのうち長いほうの名前がより長い組み合わせの図を示します.


アルファベット表記での名前の順序付きの包含関係をJリーグ全選手でたどった時の最長経路

TO(藤 海太)選手(お名前は「しいた」と読むのですね)からITO(伊藤など)⊃IMOTO(井本)⊃KIMOTO(木本)⊃KAIMOTO(海本)⊃KAMIMOTO(紙元)⊃KAMIFUKUMOTO(上福元)とたどる7名の経路です.

もう一つの経路はAN(安)⊃ANO(阿野)⊃MANO(真野)⊃AMANO(天野)⊃YAMANO(山野)⊃YAMANOI(山ノ井)⊃YAMANOUCHI(山之内)でした.こちらの経路は途中まで1文字ずつ刻んでいくのがきれいですね.

どちらの経路も全員出場している試合の実況を想像するとなかなか面白そうです.

「ローマ字表記で包含関係(順序関係なし)にあるJリーガーをたどった時,最長の包含関係」

実は「文字の順序が関係ない(並び替えられててもよい)」という条件に対する工作が先に出来上がってしまっていました.聞き間違いとか全然関係ないですが,もったいないので記事にします.処理がアルファベットの文字数を数えるだけなので,こっちの方が実装が簡単だったんですね.順序が関係ないのでより組み合わせも多く,長い経路が期待できます.さて,最長経路はいかに!(少なくとも7以上ですね)


アルファベット表記での名前の順序なしの包含関係をJリーグ全選手でたどった時の最長経路

関係する名前が多すぎてわけがわからなくなっていますが,最長は「9」.それぞれ以下です(日本語名表記は面倒なので書いていません.気になる人は公式サイトで検索してください)


  • AI⊃ISA⊃ISMA⊃SHIMA⊃OSHIMA⊃TOSHIMA⊃HISATOMI⊃MORISHITA⊃SHIMOTAIRA

  • TO⊃OTAMATO⊃TOMAS⊃THOMAS⊃TOSHIMA⊃HISATOMI⊃MORISHITA⊃SHIMOTAIRA

2つの経路はTOSHIMA選手で合流し,SHIMOTAIRA選手で終着点を迎えます.2文字から1文字ずつきれいに増えて10文字での終焉です.きれいですね.森下選手と下平選手が同一チームにいても,「あ,SHIMOTAIRAはMORISHITAの文字を全部含んでるぞ」と気づかないと思うのでこういったプログラミングはやめられません.

下の経路ではTOMAS選手とTHOMAS選手が混在しているのもニクい注目点です.TOMAS選手はスペイン国籍,THOMAS選手はトーマス・デン選手とトーマス・フェルマーレン選手で,ユニフォームの表記は確か前者はDENG, 後者はVERMAELENだったはずなのでこのパスは幻なのかもしれません.ユニフォーム登録名のデータも欲しいですね.

ということで,最長経路には稲垣選手も永木選手も永井選手も全く関係ない結果になりました.今日はこの辺で.

この記事が気に入ったらサポートをしてみませんか?