カオスエンジニアリングする組織

カオスエンジニアリング、というプロダクト開発の手法があります。2015年くらいにNetflixが発明したとされる手法です。

どんな手法かというとなかなか狂気じみてまして、実際に稼働しているサービスのサーバーだったりDBだったりネットワークだったりを不定期にランダムに落としたり、バグを仕込んだり、なんらかの異常をわざと仕込むやり方です。

なんでわざわざそんなことをするのかというと、「実際にサーバーが落ちたり何らかのトラブルがあったときになるべく早くサービスを復旧できるような仕組みを作っておこう」「どこにどんな不具合があるかは予想できないのでランダムにしちゃおう」みたいなイメージです。

学校とかマンションの避難訓練をイメージするとわかりやすいかもしれないです。私の地元の小学校の避難訓練もなかなか実践的で「図書室が出火元です」とか「理科室がが出火元です」とか「正面玄関から不審者です」とかランダムになんか起きてそれに応じた適切なルートで避難するように訓練されてました。いかのおすし。

Netflixのように24時間365日全世界中からアクセスがあるサービスだと数分のサービスダウンがめちゃくちゃな損失につながるので、日々そうやって不具合に備えてるんですね。

要はそうやって未知の不具合をあえて引き起こして対応することで組織の柔軟性を高めて強靭にしていく、って感じですねえ。


んで、サービスだけじゃなくて組織とかにも同じことが言えそうだなあと。昨今のコロナの流行とかで組織から人が突然一定期間抜けたりして予定とかがガチャっとすると、ああ組織がカオスエンジニアリングしてるなあ…と感じたりする。   

そういうときにバタバタするのか、さらっと対応するのかで組織力ってでるなあと。

アベンジャーズ的に1人が1個性を持っていて、持ち場があって担当領域があるのもすごくいいけど、いざというときに抜けができるとピンチ、という訳ですね。

バス係数、みたいな話もある。そのプロジェクトのメンバーが何人バスに轢かれるとプロジェクトが破綻するのかを表した数字。社長に完全依存している会社ならバス係数1、その下の役員も優秀である程度なんとかなればバス係数は5、みたいに使う。なるべくバス係数を高めることがリスクマネジメント的に正しい。

ただ芸能界とかサービス業は難しいとおもう。1人が専門の持ち場を持っていることがある程度前提となった仕組みだし、平均化することによって個性が弱まったりもする、活動主体のアイデンティティ問題にも関わる。

ことコロナになってからは、誰かが抜け落ちても大丈夫にする均一化と、それでも個性的でありたいアイデンティティみたいなものがとても葛藤しているようにみえる。答えはない。


この記事が気に入ったらサポートをしてみませんか?