見出し画像

ITのトラブル発生時の思考について

こんにちは。今回は、ITのトラブル発生時の思考について記事を書いてみます。現代はITが欠かせない世の中になっています。ITで起きる障害の種類と原因予測、原因への対応についてぜひ、ご参考下さい。

<もくじ>
1.障害・トラブルに気付くタイミング
2.障害・トラブルの種類
3.障害・トラブルの原因予測
4.障害・トラブルの原因追及
5.原因への対応
6.改善確認
7.心構えについて


1.障害・トラブルに気付くタイミング


【プライベートの場合】
この”タイミング”というのを1番最初に持ってきたか。というと
プライベート時の障害・トラブルに気付くタイミングというのは、”使いたい時に使えない”というタイミングだからです。ん?( ゚Д゚)どゆこと。

”使いたい時に使えない”状態は、大体の人が”緊急レベルが高い!”と感じてしまうということです。

例えば、実家に久しぶりに帰るために両親に連絡をしようとした場合に、
携帯キャリアの通信障害で電話ができない状態だとします。
すると、「何で、通信障害!?ちょっと、電話したいのに電話できない!」っと思う人もいるでしょう。このように感情が先に来てしまって両親へ帰省を伝えるのための連絡だった。という後からでも伝えることができる事でも、通信障害のせいで”緊急度が高く感じる”ようになります。

これが、悪いことではありませんが、あなたにとってこの感情は、ストレスでしかありません。障害・トラブルと緊急度は別に考えることで抱えなくてよいストレスを防ぐことができます。

【業務中の場合】
ただし、業務中に関しては別です。”使っている時に使えない”という場合は、”緊急レベルが高い状態”となります。この場合は、緊急時の対応を予め確認しておく必要があります。
業務遂行のための障害・トラブル時を想定してマニュアルが用意されていると迅速に対応できます。無ければ下記の準備をおすすめします。

・どこに相談するか
・だれに相談するか
・復旧までの運用回避方法
・復旧にかかる費用の積み立て
・予備は用意あるか

特に重要なのは、自分達で解決できない場合の相談先を決めておくことです。仮に1日の売り上げが50万だとすると4日で200万の損害になります。相談先が1日で解決すると150万の未来損失を防ぐことになります。必ず相談先は決めておきましょう。

2.障害・トラブルの種類


下記は、あくまで事例となります。
   ①システム障害
       ・プログラム不具合
       プログラム不具合は、予期せぬデータが入力されたことにより、
       プログラムの想定外の対応ができていないこと等があります。
       え?それでシステムがダウンするの?っと思われるかもしれませんが、
       処理できないデータがループし、負荷となりシステムがダウンします。

       ・バージョンアップ不具合
       システムのバージョンアップは、よくITではある障害です。
       システムが良くなるのに障害になる!?って思われますが、
      バージョンアップした途端に動かなくなるというのは、
     ITではよくあります。
      これは、バージョンアップで一部だけ最新になるが、その他が
      古いことにより動かなくなる。等が挙げられます。

   ②サーバ障害
      ・機器の部品劣化
         サーバとは、システムの根幹にあたる親機みたいなものです。
         このサーバは一般のPCとは違い数多くの精密部品があります。
         それが、経年劣化により動かなくなる場合もあります。

      ・自然災害
         ごく身近に起こる代表的なものは”雷”です。雷は、サーバにとって
         天敵です。電気が止まるとサーバ機が止まります。
         サーバには精密部品が沢山あります。適切な段取りで
         シャットダウンしないと故障の原因にもなります。それを雷は
         強制的 にシャットダウンになるため、システムの天敵ともいえます。

   ③通信障害
      ・通信機器のトラブル
          通信を行う上で、データのやりとりをしている機器(ルータ)が
          家庭、会社に設置されています。その機器が故障したり
          電源が切れていると通信障害になります。          

      ・ネット通信切断
          通信環境に何も問題が無い。という場合は、そもそもネット通信等が
          ダウンしている可能性があります。

   ④障害ではないもの
       よくあるのが、機器の電源が何らかの理由で電力が供給できていない。
       というものも少なくありません。電源コンセントから抜けていた。
       こういった事も結果、”使いたい時に使えない”現象に繋がります。

   ⑤人為的障害
       掃除をする時にケーブルを抜いて誤った箇所に差し込んでしまったり、
       誤って消してはいけないファイルを削除したりすることで、システムが
       動かなくなることがあります。

3.障害・トラブルの原因予測


    原因予測についてですが、原因予測というのは2つあります。
    ①時間軸で予測する。
    これは、”いつまで問題なく使えていたのか”をまずは特定することです。
     そうすることで、その前後関係を調べていけば原因にたどり着くことが
    できます。例)掃除する前は使えていたが、掃除した後に
    使えなくなった。場合は、明らかに掃除による影響が原因となります。

   ②外的要因を予測する。
    そもそも急に起きた場合は、自分が予測できない範囲で起きています。
    そこで、下記の例のように予測してみましょう。
    ・自分(または機器)だけなのか? 他の人(機器)は問題ない?
    ・会社のネットはダメだが携帯からは接続できるか?
    ・自分のチェック範囲内で問題なければ、社会的に影響が出ていないか?
       (通信キャリアで障害のニュースが出ていないか)
   自分の確認できる範囲で比較しながら範囲を広げて原因予測をします。

4.障害・トラブルの原因追及


   原因追及ですが、①時間軸での予測が出来た場合は、前後関係の比較を行っていけば必ず原因へ追究できますので、記憶をたどったり作業前に写真を撮っておくよいでしょう。
  ②の外的要因は、身近なところからまずは、原因予測を行い。”問題ない”という確信を”積み上げていきましょう。”そうすると、いづれ原因にたどり着くことができます。

5.原因への対応


   特にここは重要なポイントとなります。
   ”原因への対応は、即時に実行するべからず”です。は?( ゚Д゚)なんでよ。
   いやいや、原因分かったからすぐやるやろw
   っと思うでしょう。これは、一番危険です。
   例えば、掃除でケーブルの抜き差しが判明し、差し替えたとしましょう。
   それが、1か所だけなら問題ないですが、実は2か所あったら
   どうでしょうか。そう二次被害に繋がります。
   ここでお伝えしたいのが、ITのトラブルは1か所ではない可能性がある。ということです。分かってすぐに実行するのを一回、「他にはもう無いだろうか考えてみる」という思考を心がけて下さい。

6.改善確認


  ここでは、2つお伝えします。
  ①不具合が完全に治ったか確認
      これは、シンプルに問題が起きたことについて改善したか確認する
      だけですので、難しくないと思います。

  ②他に影響が出ていないか確認
      先ほど上段で説明したように他にも影響ないだろうか。を確認することをオススメします。先ほどのケーブルの抜き差しでもそうですが、自分のところは改善したのが確認できても、他のエリアが今度使えなくなっている。ということもあります。目の前だけではなく、他にも目線を向けて最終確認をすることをオススメします。

7.心構えについて


私がお伝えしたいことは、IT関連のトラブルというのは”実体が見えないトラブル”なので、想像から手当たり次第に対応してはいけない。ということと。トラブル時に冷静に対応できるようにするために、起こった場合に緊急回避方法を検討しておくことです。

それさえ押さえておけば、IT障害にも振り回されずにこれからの時代を生きていくことはできます。

ITは便利ですが、できなくなると”不便(ストレス)”になります。どうかみなさん、お気をつけ下さい。

以上。

この記事が気に入ったらサポートをしてみませんか?