マルキーニョス・ディスタンス/レボリューションズ
(「マトリックス」は1作目のみ履修済みです)
概要
Jリーグでの同僚関係の距離を1年ぶりに再計算してみた.
グラフの中心性の指標をいくつか計算してみた.
その結果,あのレジェンドがやっぱりいまだにJリーグの中心であることが判明した.
本編
この記事はこれら↓の続編です.
元ネタはtkqさんの名作↓.
エルデシュ数の説明は面倒くさいので上記の過去記事をご参照ください.また,self-containedとするために以下の記述は重複が多いです.過去バージョンに見覚えのある方は「結果」までお進みください.
ネットワーク上での「距離」や「中心の度合い」
今年の記事では2021年以降のバージョンを踏襲し,ネットワーク内での「中心の度合い」を計測する指標を複数計算し,それらから総合的に「Jリーグの中心」は誰か?という疑問に定量的にこたえたいと思います.
ネットワークと距離の定義
ネットワークとして,「同一年に同一クラブで出場経験がある」関係の選手間を結び,その距離を1とします.2選手間の距離はその間の最短経路の長さで定義します.
元データはJリーグ公式(J.LEAGUE Data Site)のみを利用しました.したがって,ほかのリーグでのチームメイト関係は反映されていません.
データサイトにエントリがあり,かつ公式戦出場経験がある選手が6250人記載されていましたので,全員とすべての組み合わせに対して距離を計算しました.
中心性の指標の数々
mean distance(平均距離):ある選手から他の全員への距離を計算し,その平均を取ります.この値が小さいとJリーガーとの同僚関係で中心に近いのではないか?という指標です.
これ以外にもネットワークの中心にいるかどうかを示す指標はいくつか提案されています.その中でも有名かつMATLABで用意されている指標をいくつか計算します.
以前試合中のパス数で計算してみた記事もあるので,関心のある方はこちらもぜひ.
degree(次数):その選手との同僚関係にあった選手の人数を表します.
betweenness (媒介中心性):betweennessは「任意の二選手間の最短経路を選択した場合に経路上に選ばれる頻度」です.「その選手を経由しないと他の選手に最短距離で近づけない」ような選手が上位に来る指標です.
eigenventor, pagerank(固有ベクトル,ページランク):いずれも「ネットワーク上をランダムウォークしたと仮定したときの滞在確率」の説明を意図していますが,pagerankではリンク構造と無関係にランダムにノードを選ぶように修正されています(Googleの検索アルゴリズムに組み込まれたことで有名な指標です)
これら5個の指標それぞれで順位をつけ,それらを一つの総合順位にまとめます.値の分布や大きさが全く異なるので,順位を重要視し,それぞれの指標での順位の積を採用することとしました.順位の積はスポーツクライミングで採用されたことでも有名ですね.
結果
さて,大変前振りが長くなりましたが結果です.総合ランクトップ20選手を示します.
Jリーグの中心性ランキング,トップはあのレジェンド三浦知良選手でした!堂々の3連覇です.平均距離では大黒将志選手,山瀬功治選手,富澤清太郎選手の後塵を拝して4位となるも,2つの指標(次数,ページランク)で1位となるなど圧倒的な中心性を見せつける結果となりました.
そして今年も総合2位は山瀬功治選手.2023年も山口でJ2出場14試合1得点はこちらもまさにレジェンド.総合指標でも1位三浦選手の2倍程度と肉薄しており(2022年は順位の積が30倍程度),2024年のJリーグ出場&首位交代が期待されます.
2020年の記事で平均距離が最小であった土屋征夫選手ですが,平均距離で6位,総合で9位(2022年8位)でした.ちなみに,マルキーニョス選手の総合ランクは251位(2022年206位)でした.
最後に,約6000人から構成されるネットワークの図を提示して本稿を締めくくります.色は総合指標値に対応しています(青:高順位,黄色:低順位).おおむね,総合順位が高い選手ほど中心に配置されやすい設定で描画しました.選手間の同僚関係は非常に薄い青線で描画しています.昨年と本当に微妙に違いますので,違いを味わっていただければ.
また来年,その気になったら更新するかもしれません.それでは!