大規模障害・復旧に気づくのは業者でも社内SEでもなく現場の皆さん
「ちょっと、このシステム使えないんだけど・・・」
先日、いつものようにある大規模障害が発生・・・
大規模障害の訪れを把握するのは、割と簡単で、
「このシステム、動かないんだけど~」
と、私の携帯電話に連絡が入り、状況を確認している・・・そばから、私の携帯電話に着信が次々と入ってくること。
そして私は、
あ~、こりゃ、何かが起きている・・・
と、大規模障害が起こっていることを把握するのである。
この時の心境は、ひと言で言えば最悪だ・・・何度経験しても慣れることはない。
何せ、大規模障害が発生したら、自分がやろうとしていた、仕事も一時中断・・・本当に勘弁して欲しい。
それにしても、最近、大規模障害の頻度が多くなっていやしないか?
ま~そんな愚痴は置いておいて・・・
■たいていの場合、社内SEにできることはない
現在の我が社において、システムの多くが外部業者に委託しているから、大規模障害が発生した場合、社内SEができる復旧作業は一切ない。
そして、社内SEが行わなくてはいけない作業としては、現場から来る連絡に謝って対応することのみ・・・社内SEにとっては、かなりしんどい時間だ。
もう少し正直に言うと、大規模障害が起こった際、全ての入電に対してきっちり対応していると、キリがないし、時間の無駄だ。
■何よりも外部業者に連絡を入れることを優先する
大規模障害が起こった際は、申し訳ないけど、現場の方からの入電は最初だけ対応して、後は基本放っておく。
そして、まずは外部業者に連絡を入れることを優先する。
現場の方からの、システムが使えないという入電、いつ復旧するのかの質問、愚痴を聞くことは結局何の解決にもならない。
最速で復旧させるには、障害状況を外部業者に知らせることが第一だ。
ただ・・・
障害の一方を入れると、外部業者も根ほり葉ほり聞いてくる。
どんな状況なのか、特定の人のみで起こっているのか、1台のパソコンで起こっているのか、複数のパソコンで起こっているのか・・・
こっちも上手く受け答えしないと、時間だけがどんどん過ぎていく。
中には全く無意味な質問や、無駄だと思う確認依頼を求められることもある。そんな質問、今回の障害には関係ないだろう・・・と思うこともしょっちゅうだ。
こっちも急いでいるので、イライラしながら話したり、時にはうそを言いながら、なるべく早く、復旧作業に取り掛かってもらえるように持って行く。
この辺りは社内SEのこれまでの経験に基づくもの・・・
どうでもいいから、あなた方が面倒みているサーバーを再起動するなに、サービスを再起動するなり、とにかく何かしらの復旧作業を行っておくれ・・・という感じ。
因みにこんな状況になっても、障害発生を業者が認めることは少ない。
■業者は認めなくても現場に障害起きましたの連絡はしてしまう
例え業者が障害を認めなくても、現場の人からしたら、システムが利用できないことは事実・・・障害起きてます連絡を早く現場の方にしないと、社内SE達の携帯電話は鳴り続ける。
そんなときは、業者が障害と認めていなくても、
”現在、〇〇システムで障害が起きてます。復旧は未定です。進捗あったら改めて連絡します。”
と、全社員宛にメールを送ってしまう。
このメールを送ることで、社内SE達への入電を減らすことができるのだ。。
■結局、復旧に最初に気づくのは現場の皆さん
因みに障害が復旧し、システムが利用できるようにったと、最初に気づくのも、現場の皆さんだ。
業者も社内SEも、システムが利用できるようになったかどうかを把握することはできない。
だから、大規模障害がいつの間にかふっきゅうしており、忘れた頃に業者から、
「今、どんな感じですか?」
と連絡が入り、そう言えばと思って、現場の方に確認すると、
「大分さっきから、使えるようになってるけど・・・」
みたいな話しになることがほとんどだ。
結局のところ、障害発生に1番最初に気づくのは現場の方、そして障害復旧に1番最初に気づくのも現場の方というお話し・・・
そして大規模障害が発生したとき、社内SEができることはほとんどないというお話し・・・
大規模障害とは社内SEにとって、何の達成感も充実感も味わうことのできない、ただただ虚しい時間なのだ。
この記事が気に入ったらサポートをしてみませんか?