見出し画像

多様性の数理モデルを作ってみる その1


1. はじめに


 ヤミちゃん、ヤミちゃん。

 ちゃんづけって……。それで、どうしたのかしら? ヒカリさん。

 この前ファミレスでドリンクバーだけでどこまで居座ったら叩き出されるかの検証をしていたら、隣の席のでこんな会話が聞こえてきたんですよー。

 後日迷惑料として1万円くらい払っておきなさい。

 「俺、多様性を重視しているとうたっている会社を受けたのに髪型を指摘されて落ちたんだ……」

 どんな髪型だろうと思ってちらっと見たら、なんとモヒカンピンクだったんですよ!

 ……なるほど、言いたいことはよくわかったわ。
 つまり多様性は大事といいながら髪型の多様性は認められなかったということね!

 いや、モヒカンって初めて見たなって思って。

 まって、私が一人で勝手に先走ってるみたいで恥ずかしいんだけど。

 でも言われてみれば確かに多様性を重視していると言っているのに謎ですよねぇ。

 ようはそれっぽいことを言ってるだけで実質何も言ってないことの典型ね。社会人としてふさわしい髪型でなければ残念ながら多様性の土俵には乗らないのが現実よ。

 やはりピンク髪はアレなイメージが強いから、社会的にダメだったかー。

 私に喧嘩売ってるのかしら?

 それはそうと、そもそも多様性ってよくきくけど、なんか曖昧でよくわからないんですよねぇ。言語化とかして、もうちょっと厳密に定義できないかなぁ。

 確かに、多様性がある状態っていうのが、異なる属性を持った人が集まってるくらいのイメージだものね。複雑な場合だと、2集団のどちらが多様かなんてわからないし。

  2集団のどちらが多様かかぁ。そういえば確かに多様性は高いとか低いとかの表現が使われますね。つまり多様性とは尺度の一つと考えていいですね。そうすると、多様性を数字で表すことができそうですね!

 そうね。なにかしらの数理モデル、例えば計算式を定義できれば、数値として表すことが可能ね。そうすれば、例えば「2集団のどちらがどの程度多様か」といったことも明確にわかるわね。

 多様性の数理モデルができたら面白そうですね! 実際に作ってみましょう。でもいきなり、これが計算式です! ってやるのは無理なので、まず多様性について言語化していく必要があります。

 実際に言語化する前に、一応認識の確認をしておきましょう。
 ある集団に属するものがすべて同じであるとき多様性はまったくないと言え、異なるものの比率が増えるにしたがって多様性が増加する、という認識であってる?

 そうね。そして異なるものの数が均等に近いほど多様性が高くなると考えて問題ないと思うわ。


2. 多様性の言語化

【多様性と抽象度との関係性】

 では言語化するにあたってまずは具体的に考えてみるのが一番! というわけで、例えばある会社に所属している人の多様性について考えてみますね。

 調べによると、その会社は100人が所属していて、男性が70%、女性が30%、J民族が50%でA民族が50%、さらに右利きが90%で左利きが10%、社長が1%で社長以外が99%です。

 一見すると判断が難しいわね。でも全員が人間である以上は多様性はないと思うわ。

 ちょっと待ってください。確かに全員人間ではありますが、全員顔は違うはずです! そう考えるとものすごく多様性にあふれてると言えるのではないでしょうか!

 た、確かにっ……! なんだかよくわからなくなってきたわ!
 全員人間であるという見方をすれば多様性はないけど、全員顔が違うという見方をすれば究極的に多様と言える……?

 いったいこればどういうことなのでしょうか! この問い自体に真逆な2つの結論が出てきてしまっています!

 いや、ちょっと悪ノリしたけど要は抽象度によって多様性が変化してしまうという問題でしょう。

 タイトルでネタバレ!

 抽象度を高くする=全員人間であるととらえると、細かな差異は無視されてしまうためにすべてが同じになってしまう、すなわち多様性がないと解釈されてしまう。

 一方で具体度を高くする=全員顔が違うととらえると、極めて細かい個人に依存するような性質まで検出されてしまい、全員が完全に異なる存在と解釈されてしまう。

 つまり、どのレベルの抽象度か、すなわちどこまでを差として認めるかによって多様性は変わってしまうということですね! じゃあ見方を変えればどうとでも言えちゃうじゃないですか!

 そうね。適切な抽象度なるものを規定できない以上、単にその集団の多様性がどうであるかは決定できない、端的に換言すればその集団の真の多様性の程度なるものは存在しえないことになる。
 つまり、「○○という観点で見たときの多様性」と厳密に規定する必要があると言えるわ。


【あらゆる種類の性質を知ることの困難性】


 「○○という観点で見たときの多様性」と厳密に規定、となると、例えばここに上がっている情報として男女、民族、利き手、社長かそうじゃないかという4つ観点がありますね。

 ではここで利き手という観点についてみてみましょうか。

 利き手には右利き左利きの2種類があって、その集団におけるそれぞれの比率が示されているから、これらの値を使ってなにかしらの計算を行えば多様性を数値で表せそうね。

 ちょっと待ってください。世の中には両利きという人も存在します。このことを考えると、右利きが90%で左利きが10%で両利きが0%とも言えてしまいます。すると計算の仕方によっては、両利きを考慮するかによって結果が変わってしまいます

 た、確かに……。これは厄介だわ。
 でもまあ、両利きが現実的に存在する以上は入れておいた方が適切な気がするわね。

 では次に民族についての観点はどうでしょう。

 これはJ民族とA民族の2種類からなってるけど、さっきと同じようにそれ以外の民族も含めて考慮して計算する必要がありそうね。
あと現実に存在する民族は……

 ……あれ、待って。いくらなんでも多すぎない?
 というかそもそも地球上に現存するすべての民族なんて把握できてないわよ。

 言われてみれば、そこに含まれる実在する性質なんて必ずしも現実的に把握できるとは限らないんですよね……。これでは正しい計算を行うことは現実的に無理そうです……。

 そうすると、現実的な計算に落とし込むには、これらの性質だけを含めて計算すると決めてしまうしかないわね。その観点で見た時の真の多様性自体が現実的に計算できない以上は。

 そうですね! そしたら、「ある観点でみたときにここまでの性質を計算に含めますよ」というのは長いので、これを定義域と呼ぶことにしましょう。そうすると、先ほどの会社においては次の4つの定義域があると書き換えられそうですね。

{男, 女}
{J民族, A民族}
{右利き, 左利き, 両利き}
{社長, 社長以外}

 そしてその4つの定義域においてそれぞれの多様性があるわけだから、この集団は4種類の多様性があるととらえられるわね。

 4つも多様性の基準があったら、やはりどうとでも言えてしまうんですよね。なのでこれをなんとか1つにまとめる必要があるかもしれませんね。


【集団内の多様性と集団間の多様性】

 さて、ここまでの問題に対して現実的な対処ができるなら、計算のフェーズに入っていけそうね。

 た、大変です! インターネットの海から新たな問題提起が漂着しました!

 な、なんですってぇー!

瓶の中の多様性は高そうだがどの瓶も似ている/瓶の中の多様性は低そうだがどの瓶も似てない

 こ、これは……! 複数の集団が集団を作ってます! しかも、片方の”集団の集団”の中にある集団はいずれも多様性が高そうですが、しかしどれも似たような集団になってしまっているように見えます! もう一方はそれぞれの集団の多様性は低そうですが、どれも異なる集団に見えます!

 また厄介なものが出てきたわね……。つまり、本当に集団の中身だけを考慮すればいいのか、ということね。集団同士でも多様性というものがあるんじゃないのか、同じような集団が集まった集団は本当に多様性が高いと言えるのか、ということね。

 「集団の集団」は紛らわしいのでこれを「群集」と呼ぶことにします。
この群集の多様性をどう考えるのかが問題のようですね。

 各集団の多様性を平均したものととらえれば単純だけど。

 本当にそれでいいんでしょうか。
 集団に含まれるもの、ここでいえば飴玉を「要素」と呼ぶことにします。飴玉の入った瓶が「集団」にあたり、瓶の集まりが「群集」ですね。そして飴玉の色を「性質」と呼ぶことにしましょう。飴玉の色の定義域は{赤, 青, 黄, 緑}になります。

語句の意味の例

 これを抽象化して、群集にあたる瓶の集まりを集団とみなすと、本来の集団にあたる瓶を要素と解釈できます。すると瓶の性質は例えば赤30%青70%の性質を持っているみたいな解釈が可能です。

 このように考えれば性質が離散的(バラバラの値をとる)か連続的かの違い(飴玉のある性質は0か1かしかとらないが、瓶のある性質は0.3とかの値をとれるという違い)はあれど瓶同士の多様性が群集の多様性にあたると解釈できるのではないでしょうか。

 なるほど。集団の多様性がそこに属する要素がどのくらい多様であるかによるように、群集の多様性はそこに属する集団同士がどのくらい多様であるかによると解釈できる、と。すると群集の多様性は集団そのものの多様性とは独立したものということになるわね。

 ただし、例えば「群集の多様性は各集団の多様性の平均と定義すること」が不可能なわけではないわよ。ただ現状はその定義が妥当とも不当とも判断できないので、この点については保留するしかなさそうね。

 いずれにしても多様性には集団内の多様性と集団間の多様性(=群集の多様性)の2種類があると考えてよさそうですね。そしてこの2つは完全に独立したもの、として考えた方がいいのでしょうか。

 そうね。一方は集団内の要素がどれだけ多様なのか、もう一方は集団自体がどれだけ多様なのかという話なので、多様性の尺度の対象が異なるわ。


3. 多様性の数理モデルを作るには

 そうすると、多様性を計算することを考えたときに、基本的には群集を想定し、集団間の多様性とそこに含まれるそれぞれの集団内の多様性を計算するとした方がいいですね。

 全体的な構想としてはそれでいいと思うわ。あとは曖昧さを排除していかないといけないから、計算式を作る前にそれぞれの多様性を定義する必要があるわね。そのためには、多様性の定義に関わる語句を定義する必要があるわ。

 そうですね。現段階ではざっくりとしたイメージのものを言語化することで、徐々に厳密性を高める段階なので、どうしても曖昧性を排除しきれていません。なので語句にちゃんと意味づけを行っていき、そこから多様性とは何かを決める必要がありますね。

 とりあえずこんなところかしら?

 いえ、計算式を作る前に公理系もしっかりと決めた方がいいですね。例えば、多様性が相対的に高いと認識される状態を数値化したときに、相対的に高い数値になる必要があります。こういった計算式を作るための出発点としてこういうのを正しいとする、というのを決めておかないとなんでもありになってしまい混乱します。

 そうだったわね。定義と公理の2つがあれば計算式を組み立てられそうだわ。だたせっかく数理モデルがあるなら、それを使っていろいろと分析したくなってくるわね。

 いいですね! 計算式をプログラムに落とし込んであげればコンピューターシミュレーションができます! そうすれば、どこかのパラメータにランダム性をもたせて、他のパラメータを固定すれば、それぞれの多様性がどういうパターンのときにどのような値をとるのか分析できそうですね!

 そこに集団間の多様性と集団内の多様性がとる値を比較すれば、その2つの関係性もわかりそうね! これは面白くなってきたわ!

 今回はここまでになります。なんだか話が膨らんで、数理モデルの作成に加えてそれを使ってシミュレーションを行うことになりました。

 今回は多様性についてある程度言語化できてきたので、これをもう少し整理して多様性を定義していきます。また公理系の構築もおこない具体的な数式を作っていきます!

 それでは頑張っていきましょ~!

【次回はコチラ】




 ところで、社長が1%で社長以外が99%ってなに?

 多様性に反してるように見えるけど、社長は何人もいていいものではないというこの社会の不条理さと理不尽さを端的に表してしまうために、闇に葬られたデータを掘り起こしたものですけど。

この記事が気に入ったらサポートをしてみませんか?