数字詐欺:99.9%詐欺
Web証明書がエラーでていたので、Web屋の代わりにDNSサーバーを直していた昨今いかがお過ごしだろうか?代わりに作業やっても一円も貰えないのに(愚痴)
今回は、数字を利用した詐欺の話であるが、この話は、疑似数学と言うにはおこがましいかな。99.9%は直感的に、ほぼ確実に聞こえる数字なのだが、実際に計算してみると全然信用出来ないと言う奴。
この詐術はマーケティングでよくやられている手法で、いくつか手口を知っているのだが、恣意的な母数抽出と自社に有利なベンチマークのトリミングを取り上げても仕方無いので、数字は合っているけど、信用出来ない例を
あげていこうと思う。
取りあえずクラウドで良く言われる高可用性99.9%を計算してみよう。高可用性とはどれだけ安定してサービスが提供できるかと言う指標である。
それでは実際に計算してみる、1年でどれだけサービスが落ちているかである。この数字には当然、上に載っているサービスが落ちているのは含めない。システムが落ちているのはそのシステムを作ったベンダーの責任でクラウド自体には無い。
365.24(1年)x (1 -0.999) = 0.36524 日 ≒ 8.8時間
高可用性99.9%は、年に一回は落ちると言っているのと同義なのである。
AWSが落ちるとニュースになっているが、年2回、4時間のサーバーダウンが起きていたとすると99.9%と計算出来る。
そう数字自体は間違っていないのだ。実は高可用とは言い切れないのであった。そのため嘘は言っていないけどホントのことも言っていないと言うマーケティング的言い回しに使い安いのである。企業系の大半のシステムには適用できると思われるがミッションクリティカルには厳しいのであった。高可用性99.9%と言うのは、年一回は、クラウドの所為でサービスが落ちると言う前提でサービスを構築しないと危ないのである(それ以外の理由でも落ちるので冗長化を続けるとやたらとコストがかかるのだが)
※ み○ほは、可用性99%かな。年8日ぐらい落ちている気がするし。
次は検査詐欺である。陽性がでたとき、99.9%の可能性で正しいと言う奴。0.1%は偽陽性なので優秀に見えるだろうが、そうでは無い。
まず計算しやすいように人口(母数)一億人と仮定し、実際の患者を1万人と仮定しよう。
有病率は0.01%になる。では実際に検査したときにどの程度正しいか計算してみる。1万人をランダムサンプリングした場合、患者は大凡1人、残りは患者ではない。また誤陰性の確率を0%と優遇する(現実にはそんな検査無いけど)
それ以外の偽陽性が、9999 ×0.1% ≒ 10人でる。誤陰性率は0なので陽性は11人出る計算になる。陽性がでた11人のうち10人が偽陽性であり、偽陽性率は10/11になる。要するに99.9%は、無作為抽出だと90%の確率で外れると言う意味になる。
そのため検査は、症状的にその可能性が十分にあると判断したとき以外には行なわないのである。
五分五分の可能性まで狭めて1万人の集団を取り出した場合。患者は5000人になる。このときは5005人になる。誤検出0.1%、これなら検査として優秀である。