エンジニアが超平和な世界と現実

結論
想像できますか?

ケース1 システム障害は仕方ないと思う世界

ある時、突然全銀オンラインシステムが止まりました。全銀オンラインシステムとは他行でもお金がおろせるシステムです。それだけでなく、これが止まると日本の銀行間のやりとりが全て止まります。支払いも受け取りもできません。ここはエンジニアが超平和な世界です。トラブルは深夜起きましたが、エンジニアは朝9時にならないと出社しません。出社後日々のメールチェックなどの日々のルーチンが始まります。メールで全銀オンラインがダウンしているとわかります。エンジニアは解析を開始します。それと同時に正常に動いていた時のシステムに戻す作業、止まる前の取引のデータの吸い出しなどを行ってるとランチの時間になりました。当然、お気に入りのお弁当屋さんに向かい、少し並んでから大好きな唐揚げ弁当を購入します。そして座席に戻りお弁当を食べながらネットサーフィンをします。昼休みが終わり正常起動してた時のシステムも動かないことに気付きます。これはタイマー関連の不具合かもしれないなと考えます。システムの時間をシステムが止まる前の時間にしたら動きますが、止まった深夜の時間になると止まります。時刻が問題だとしたらここかな、あたりを探ります。15時、缶コーヒーを買って飲みながら、時刻関連じゃなかったから何がトラブルかなと考えてたら上司からすぐ直りそうかと聞かれました。少し考えてから、原因が何かわからないですし、正常起動してたデータも動かないから復旧が難しいことを説明します。上司はじゃあとりあえず3週間くらいで直ると言うと、エンジニアもまあ、そんなもんですかねと答えます。そしてメディアで今起きてるトラブルは復旧に3週間ほど時間がかかると報道されます。ニュースを見た方はシステム障害だから仕方ないか、やれやれ。

ケース1が実際に起きたら
突然携帯が深夜になります。システムダウンか。服も着替えずすぐに会社に向かいます。電車はないので経費で降りないタクシーに乗ります。会社に着くと近場の同僚はすでにシステム復元を開始してました。
何分で戻る?
動くだけなら1時間、データ戻して2時間。合計3時間かな。
じゃあその間になぜ落ちたか解析するか。

3時間後

動かないな。
時刻関係のトラブルだとしたら、結構深いところが問題だな。
そうすると時刻関係の処理を飛ばして後から付加するプログラムを書いた方が良さそうだ。
午後には動くだろうな

早朝
上司が出社。
いつ直る?
午後には。
3時間はやめろ。
テストができません。
動けば良い
…わかりました

2時間後
…動きました。
あと1時間で本番環境に切り替えれるか
…少し厳しいかと…
何とかしろ

1時間後
本番環境、動きました
よし、システムは復旧したと発表する
…問題が解決してないのですが… 
動かしながら解析して直せ
…またですか
ああ、いつものことだ

よろしければサポートお願いします。頂いたサポート費用は、本の購入、より良い情報発信のためにありがたく使わさせていただきます。