見出し画像

2019年M-1直前に振り返る「上沼恵美子さん採点偏ってる問題」の本質は視聴者の「認知バイアス」だ

このnoteはM-1グランプリが始まる直前の12月20日に公開しています。したがって、M-1グランプリ2019年に何が起きるかさっぱり分からない状態で書いています。また更新する予定はありません。

2019年のM-1直前にどうしても書いておきたかったのが、2018年の上沼恵美子さんバッシング問題に対する「私なりの解」です。

このnoteがご本人に届くとは思いませんが、上沼さんには2019年の審査をスッキリした気分でやって欲しいし、見る側も「どうせ依怙贔屓だろ?」みたいなモヤモヤを抱えて欲しくない。

誤解だよ!と言いたいのです。

改めて、バッシング問題を振り返りましょう。

審査員コメントを求められた上沼さんの、以下のような発言がSNSで批判を集めた…とされます。以下、コメントを並べてみましょう。

「(ミキの)ファンだな。ギャロップの自虐と違って突き抜けてる」
⇒ミキに98点。ギャロップに89点。
「ジャルジャルはファンなんですが、ネタは嫌いや」
⇒ジャルジャルに88点。
「(トム・ブラウンの漫才に対して)未来のお笑いって感じかな。私は歳だからついていけないや」
⇒86点。

好きとか嫌いとか、直感的な単語が並んでいます。

上沼さんは好き嫌いで採点をしているのではないか、言い換えると採点は偏っているのではないか、それは審査員として許されるのか、というバッシングがSNS上で起きました。

とろサーモンの久保田さんやスーパーマラドーナの武智さんもそう感じたのか、インスタライブで酔った勢いでやらかしてしまいましたね。

「審査員の皆さん、もう自分の感情だけで審査するのやめてください。1点で人の人生変わるんで、理解してください」

「お前だよ!分かるだろ?右側のな!クソが!!」

ちなみに関西では上沼さんの悪口を言うと、家族6親等まで矢面追われるんですよ。絶対に言ってはならないんです。

後日、鈴木祐司さんが以下のような記事を挙げていました。内容よりも「上沼恵美子」と呼び捨てにしているのに驚きました。テレビ局の人は芸人を呼び捨てにするんだ。ふーん。きっと愛知出身やから、偉大さなんてこれっぽっちも理解できないんだ。

淡路島は上沼恵美子さんの庭やぞ!すごいやろ!

好き嫌いによる採点は、能力と得点の乖離、得点の偏りとなって表れます。

・本当は能力があるのに、嫌いだから不当に得点が低くなる。

・本当は能力も無いのに、好きだから不当に得点が高くなる。

実際はどうなのか。検証してみました。


まずは2018年の得点を振り返る

2018年の得点を、ヒートマップで表現して見ます。80点以上を5点刻みで4段階評価しています。

図1

全体的に高得点を示す赤、濃赤が目立ちます。特に、中川家礼二さんは全員90点以上から採点しているのだと分かります。

メリハリがついているように見えるのは、上沼さん、松本さん、志らくさんでしょうか。

次に得点を箱ヒゲ図と平均(表上)&標準偏差(表下)で表現します。

図2

上沼さんはヒゲ上端98点(ミキ、和牛)~ヒゲ下端84点(ゆにばーす)で、上下端が14点開いています。標準偏差も4.93ともっとも高い。

大好きなミキ、和牛、霜降り明星、普通のかまいたち、嫌いなスーパーマラドーナ、見取り図、トム・ブラウン、ゆにばーす…とも見えます。なるほど数字だけを見れば「好き嫌いが激しい」ようにも見えます。

しかしグラフの通り、上下端が広いのは上沼さんだけではありません。

志らく師匠も標準偏差が4.52と高く、ヒゲ上端99点(ジャルジャル)~ヒゲ下端85点(見取り図)で同じく上下端が14点開いています。

さらに松本さんもヒゲ上端94点(霜降り明星)~ヒゲ下端80点(ゆにばーす)で上下端が14点開いています。

ナイツ塙さんに至っては、ヒゲ下端85点(見取り図)ですが、外れ値として82点(ゆにばーす)を記録しています。MAX~MINで考えると16点開いていて、誰よりも「好き嫌いが激しい」

つまり、採点のメリハリが効いているのは上沼さんだけでは無いし、他の人と比べても、特別変わっているとはとても言えません。ただ、採点の振れ幅が大きいか小さいかの違い、採点の付け方の違いなのです。

■採点の振れ幅が大きい
上沼さん、松本さん、志らくさん、ナイツ塙さん

■採点の振れ幅が少ない
巨人師匠、中川家礼二さん、サンド富澤さん


主成分分析で分かる採点の傾向

続いて、7人の採点を主成分分析を用いて縮約します。

■主成分分析とは…
たくさんある列を、全体が分かりやすく見通せる1~3程度の列(次元)に要約していく手法。この要約は「次元の縮約」という表現で呼ばれる場合もある。要約した合成変数のことを「主成分」と呼ぶ。

Rで実装しました。

# M1.csvはヒートマップを読み込んでいると思って下さい
m1 <- read.csv("M1.csv")
rownames(m1) <- m1$演者
pca <- prcomp(m1[,2:8], scale=T)
summary(pca)

Importance of components:
                         PC1    PC2     PC3     PC4     PC5     PC6     PC7
Standard deviation     2.2751 1.0401 0.64388 0.39295 0.33587 0.21723 0.11441
Proportion of Variance 0.7394 0.1546 0.05923 0.02206 0.01612 0.00674 0.00187
Cumulative Proportion  0.7394 0.8940 0.95321 0.97527 0.99139 0.99813 1.00000

PC1とPC2で、「Standard deviation」が1を上回ったので、この2つに縮約できたと考えます。

この辺りの実装、何をやっているかよく分からないという方は、7人の審査員の得点を、2列に圧縮したと捉えて下さい。7人でそれぞれ傾向があって分かりづらいのですが「似た者同士の2列」があれば、それを1列にまとめます。7人分のデータ→2つの傾向にまとめて可視化しやすくなったと考えてください。

主成分分析の結果を図表で表現します。7列あった結果を2列に圧縮して、大まかな傾向が散布図から見えてきました。

図3

PC1は「採点の高低」を表していそうです。PC2は少し複雑で、7人の審査員の「採点の独自性」と言い換えても良いかもしれません。

その観点で、改めて散布図を見て下さい。

巨人師匠とサンド富澤さんはほぼ完全に重なり合い、松本さんとナイツ塙さんもほぼ重なり合っています。それぞれ得点の傾向が似ているのです。

そんな中で、上沼さんと志らく師匠は両端に振り切れています。また中川家礼二さんもどちらかと言えば、4人よりからは外れている。

確かに志らく師匠は全体3位だったジャルジャルに99点、全体6位だったトム・ブラウンに97点と高評価です。

そう言えば、ジャルジャルの99点には「1つも笑えなかったんですが面白かった」という志らく師匠の発言に対して批判もありました。

これは志らく師匠が「好き」で採点していると言えるのでしょうか。違いますよね。ただ他の人と違う点で評価を下しただけです。

もし全員が全員、独自性無き採点をしていたら、同じような傾向の漫才に特典が集まりますよね。違った人が違った評価をして、それでも共通して皆が面白いと言うからM-1チャンピオンなのです。

■他の人と比べて採点の付け方にその人らしい独自性がある
上沼さん、志らくさん、中川家礼二さん

他の人と比べて採点の付け方に独自性があるとまで言えない
巨人師匠、サンド富澤さん、ナイツ塙さん、松本さん


上沼さん、志らく師匠が結果を捻じ曲げたのか?

上沼さんが言われなきバッシングを浴びたのは「採点の振れ幅が大きい」「他の人と比べて採点の付け方に独自性がある」から、発言も重なって「好き嫌い」のように見えたのではないでしょうか?

ここで、実験をしてみたいと思います。

上沼さん、志らく師匠に対する批判として「その独自性ある採点の付け方で順位が変わったのではないか?」というニュアンスがあるでしょう。

では、なぜ中川家礼二さんは批判を浴びなかったのか?

上沼さん、志らく師匠が「採点の振れ幅が大きい」から目立ったのではないでしょうか。もしも「採点の振れ幅が小さい」ならば目立たなかったかもしれません。

もし、採点の振れ幅が小さくなったとしても7組の順位が変動しなければ、その順位は7人の総意と言えるのではないでしょうか。

そこで、上沼さんの採点が標準偏差4.93に対して、中川家礼二さんと同じく標準偏差1.90になるよう、平均点91.10点のままで得点を修正しました。

図4

その結果、審査結果はどう変わるでしょうか?

図5

上位3者には影響を与えず。トム・ブラウンが上位に上がりましたが、それでもジャルジャルには14点も及びませんでした。

続いて、志らく師匠の採点が標準偏差4.52に対して、中川家礼二さんと同じく標準偏差1.90になるよう、平均点90.50点のままで得点を修正しました。

図6

その結果、審査結果はどう変わるでしょうか?

図7

なんと、変動無しでした。

では上沼さんの修正後得点と志らく師匠の修正後得点を、それぞれ合算して見ました。審査結果はどう変わるでしょうか?

図9

ミキとかまいたちの順位が入れ替わったぐらいで、上位3者には影響を与えませんでした。もちろんスーパーマラドーナの順位は全く変わりませんでした。繰り返しますが、もちろんスーパーマラドーナの順位は全く変わりませんでした。

それぐらい、霜降り明星、和牛、ジャルジャルは7人の審査員が「面白い」と認めていたのではないでしょうか?

10組の演者の得点を箱ひげ図で表現してみました。それぞれの演者に線が引かれているのは平均値であり、ジャルジャルとミキの差は1.43点です。相当大きな差でした。

図10


なぜ上沼さん・志らく師匠は誤解されたのか?

SNSが発達して、特にTwitterで自分の意見を発信できるようになりました。メリットもありますがデメリットも多くあります。

それは「認知バイアスのワナ」です。

無意識的に「自分に都合のいい情報」や「先入観を裏付ける情報」だけを集め、反する情報を探そうとしない確証バイアス。上沼さんが好き嫌いだけで得点をつけていない、というデータを集めたでしょうか。

自分がそうだと確信していることに反する事実や他者の主張は、無視してしまったり、その主張のあら探しをしてしまいやすい信念バイアス。志らくさんはTwitterで反論してくるから余計に腹が立つと思いませんでしたか。

こうしたバイアスに陥ると、自分とは反対意見を述べる上沼さんや志らく師匠に反感し、一斉に攻撃する。するとメディアも「上沼さんSNS炎上」と面白おかしく報道する。

今回の出来事を振り返ると、上沼さんや志らく師匠が誤解された原因…正確に言うと勝手に捉え間違えた原因は、こうしたバイアスにあるのではないでしょうか。

上沼さんや志らくさんの発言を聞いて「そのような感情が得点に反映されている」と真に受けすぎたのです。

お二人のようなプロが、そのような感情だけで採点するわけが無い。様々な観点を鑑みて、考え抜いて採点しているのであって、求められたコメントだけで類推するのはちょっとどうなんでしょう。

このような現象を、結果を見てから原因のストーリーを創作して納得する「結果バイアス」と言います。因果関係の認知の歪みを意味しています。

2019年のM-1は、そうしたバイアスを抱かず、心の底から漫才を楽しみたいものですね。

1本書くのに、だいたい3〜5営業日くらいかかっています。良かったら缶コーヒー1本のサポートをお願いします。