見出し画像

多様性の数理モデルを作ってみる その4

【前回はコチラ】

 こんなところに迷い込まれてしまいましたか。ここは多様性の数理モデルの裏ステージ。君はこの高難易度のステージを乗り越えられるかな?

 わけわかんないこと言ってないでちゃんと説明なさい。多様性の数理モデルは結論まで出て終わったはずでしょ? このおまけ記事は一体なんなのかしら?

 集団内の多様性と集団間の多様性はそれぞれ群集の多様性を別の基準でみたものであり、それぞれが独立した値として扱いました。これでは群集の多様性は2種類の値を持つことになります。そこでそれをなんとか1つの値にできないかを考えてみます。

 もしかして、また定義や公理を作っていくのかしら? いい加減ついてこられないと思うわ。

 いえいえ。定義や公理は今までのものを流用しつつ、ほんのちょっといじるだけで済みますよ。


12. 多様性数理モデルの拡張

【考え方】

 一つの値にまとめるってったってどうするつもり?

 それぞれが全く異なる角度からみたものになりますので、単純に足したり掛けたりするのは妥当ではありません。なので、多様性の範囲を複素数に拡張し、前回の結果で出したようなグラフを複素平面としてとらえます。

 なるほど。だから高難易度ステージなのね。とはいえ、理系の人からすればかなりイージーな部類ではあるでしょうけど、そうでない人からするともうよくわからなくなってくるわけね。いや、Σが出てきてる時点でそうなってる気がするけど。

 ま、そういうことですねー。そして複素数に拡張し、集団間の多様性と集団内の多様性を合わせたものを「複素多様性」と呼ぶことにしましょう。

【定義と公理の拡張】

 というわけで、実際に定義と公理を拡張していきましょう。

 まず、実数として値を取りうるのは集団内の多様性と集団間の多様性に限り、複素多様性は複素数となるように拡張します。

 そして複素多様性Div*は集団間の多様性Div_btwと集団内の多様性Div_in、そして虚数単位iを用いて次のように定義します。

$$
複素多様性: Div^*=Div_{btw}+i Div_{in}\\
 \\
絶対値: \mid{Div^*}\mid =\sqrt{Div_{btw}^2+Div_{in}^2}\\
(0\le\mid{Div^*}\mid\le\sqrt{2})\\
 \\
偏角: D=\tan^{-1}\frac{Div_{in}}{Div_{btw}}, (0\le D \le \frac{\pi}{2})
$$

 しかも、インターネットの火薬庫ことTwitterで周期的に爆発炎上する三角関数まで出てきてしまうわけね。

 しかもオイラーの公式を適用すると、指数関数まで出てきてコンプリートです! eはネイピア数ですね!

$$
Div^* = \mid{Div^*}\mid e^{iD}
$$

 わかったから話を進めなさいな。あと微分積分が出てきてないから高校数学コンプリートじゃないわよ。

 ここで偏角というものがでてきましたね。これが何かというと、まあ式のとおり「集団間の多様性と集団内の多様性の比」にあたり、値が大きくなると集団間の多様性に比べて集団内の多様性が大きくなります。そして、集団間の多様性が0をとる可能性があるため、tanを用いて角度にすることで、とりうる値を実数にしているわけですね。

 そして複素多様性の絶対値と偏角の組み合わせは極座標ね!
 この形式であれば、多様性の程度と集団内・集団間のどちらの影響度が大きいのかがわかりやすいかもしれないわね。

 まあ、そこについては好みの問題もありますが、絶対値を群集の多様性の尺度とすることは可能だと思います。
 ただ、複素多様性はそれぞれの多様性を一つの値に集約でき、なおかつ数値的情報が失われないような群集の多様性を表せる表現であることがこの話のポイントです。


13. コンピューターシミュレーションによる分析

【分析】

 前回の記事と同じ条件になりますが、パラメータ変動による影響のグラフに、複素多様性の絶対値と偏角を追加しました。複素多様性の範囲は[0, √2]、偏角は度数で示したので範囲は[0, 90]です。

 偏角は45を下回っていれば集団間が、上回っていれば集団内の多様性が高いことになります。また、偏角の標準偏差のみ縦軸の最大値が14となっています。これは偏角の数値の大きさによるものですね。

【要素数の影響】

 複素多様性絶対値は均等(占有率1)のときは要素数が増加するにつれて複素多様性は増加する一方で占有率が9以上だと減少傾向にあるみたいね。集団間の多様性は減少するけど集団内の多様性は大して増加しないからそうなるのね。

【集団数の影響】

こちらも集団の数が増えても、占有率が9以上だと複素多様性絶対値はほとんど変化しません。一方で均等の場合は減少傾向にありますね。ただし、占有率が高く集団数が少ないほどばらつきやすいみたいですね。

【性質数の影響】

 これも前回と変化なし。性質の数が増えると複素多様性絶対値が増加する傾向にあるわね。とはいえ、偏角がちょっと特徴的な形状になってるわね。
 占有率9以上では、性質数が10以下だと増加傾向だけど、10以上の範囲では減少傾向にあるわ。


14. 結論

 複素多様性と偏角について分析しましたが、各多様性のグラフから、まあだいたいそうなるだろうなっていうのが正直なところですね。

 それはそうだけど、均等か占有率が9以上かで明らかにグラフの形状や、パラメータを動かしたときの傾向が異なっていることが明確だったわ。

 まあ要因は集団内の多様性の変化の影響でしょうけど。それはさておき、均等かそうでないかで傾向が変わっているという点については、前回、占有率5を上回ると集団間の多様性の方が分け方による影響を受けやすくなるだろうという話でしたので、それぞれに占有率5のときのグラフを追加してみましょう。

 要素数の影響については、占有率5でグラフがほぼ平坦になってるわね。つまりここのラインが複素多様性絶対値の傾向が変化する境目とみてよさそうだわ。

 一応他のパラメータについてもみてますと、集団数の影響と性質数の影響については一応占有率1と9の中間に位置していますが、どちらかというと占有率9に近い形状ですね。つまり集団数と性質数の影響は要素数に比べて占有率の影響を受けやすいのだと考えられます。


15. おわりに

【ソフトウエアの使い方】


ちょしゃ

 はいどうも、著者です。ただの色違いではありません。口が開く捕獲用のボールを投げるのはやめてください。せっかくなので最後にソフトの使い方について説明します。

 【こちらのリンク】パソコンからとんでいただき、codeという緑色のボタンを押して、Download Zipを押していただくと、ダウンロードできます。Zipでダウンロードされるので、右クリックから展開してくださいね。
 そしたらindex.htmlというのをダブルクリックしますと立ち上がります。ブラウザはChrome, Edge, Firefoxのいずれかを推奨しています。

 まず、群集に含まれる集団の数と定義域の設定を行います。今回は例えば図のように集団数10にしてみましょう。そして定義域は{赤,青,緑}にしましょう。定義域は半角スペースまたはコンマ区切りになります。

 もう1種類定義域を追加したいので、「定義域を追加」のボタンを押して、入力欄を追加しましょう。追加した欄には{○, □}と入力しましょう。

 次に分析の方法を選びます。各集団の要素の内訳を「固定」するパターンと「ランダム」にするパターンがあります。
 「固定」とは、どの集団にどの要素がどのくらい入っているかが決まっているときに、各多様性を算出します。
 一方で「ランダム」とは、集団に要素をランダムに振り分けることを何度も繰り返して多様性を算出します。今回行った分析がこれにあたります。
 最初に「固定」の場合について説明しますので、上のボタンを選んで「要素数と集団数を設定する」ボタンをおしてください。

 そうすると、縦に集団(Group1~10)が並び、横には要素の種類が並びます。このマトリックスの入力欄に数値を入れていきます。例えば、Group1に[赤,○]が5個入るのであれば、左上のGroup1と[赤,○]が直交する欄に5と入れます。

 面倒なときは、数値の一括入力という欄に数字を入れて「一括入力」ボタンを押すと、すべての欄に同じ数字が入ります。
 また、青で示された数字は、各行列に入力された値の合計です。
 適当に数字を入れ終わりましたら、「多様性を計算」ボタンを押します。

 下の方に様々なパラメータの計算結果が出てきます。
 結果をテキストファイルにしたい場合は「結果をテキストに保存」ボタンを押すと、ダウンロードフォルダに保存されます。テキストはタブ区切りなのでそのままコピペでエクセルに貼り付けられます。また、文字コードはutf-8なので、VBAなどでそのまま読み込むと文字化けするので注意してください。
 ファイル名はデフォルトでresult.txtですが、ファイル名の欄を変えることで保存するときのファイル名を設定できます。
 様々な分析結果のチェックボックスが並んでいますが、これはテキストで保存する際にいらない結果のチェックを外すと、その結果を除外してテキストで保存されます。
 「設定を変更する」ボタンを押すと、最初の画面に戻りますので、それをおしてください。

 集団の内訳が「ランダム」のときの説明になりますので、こちらを選択してください。
 こちらにもまた分析方法がありまして、各集団に入る要素数が「固定」のと「ランダム」の2つがあります。

 最初に「固定」のときの説明をしますので、そちらを選んでください。今回行った分析は「固定」になります。
 また、ここでは繰り返し回数を設定します。繰り返し回数を100回に設定し、「要素数と集団数を設定する」ボタンをおしてください。

 こちらはそれぞれの要素がいくつあるかと、各集団にいくつの要素が入るのかを設定します。

 一括入力機能を使って、要素をすべて10個、入る要素数をすべて6個に設定します。この分析ではこれら2つの個数が同じでなくてはいけません。「多様性を計算」ボタンを押します。

 ずらっと結果が表示されます。保存などの操作は先ほどと同じです。

 最後に「ランダム」の場合を選びます。

 ランダムの場合は要素の数のみ設定します。

 内容は以上となります。

【最後に】

 これにて今度こそ終わりになります。ここまで読んでいただきありがとうございましたー。それではまた別の記事でお会いしましょー!

 それがいつになるのやら。気長に待ってちょうだいね。


あとがき(投げ銭用)

ここから先は

2,946字 / 2画像

¥ 500

この記事が気に入ったらサポートをしてみませんか?