R01 SM PM2-2 重大なインシデント発生時のコミュニケーションについて



設問ア
1.携わったITサービスの概要
 Z社は、全国に50の支社を持つ、通信事業者である。Z社は自社開発したネットワーク機器を販売している。Z社が開発したUTM機器である「B」(以下、Bという)は、Z社技術部開発課が自社開発し、Z社技術部サポート課がインシデント対応などのサポートデスク対応を行っている。
2.発生した重大なインシデントについて
 先日、Bが夜間に実行する機能更新プログラムに不具合が発生した。その不具合は、通常通信を過検知することで、特定のネットワーク通信に遅延をもたらすという症状(以下、今回症状という)であった。
2.1 発生した重大なインシデントの概要
 B社では、一時間以上を継続してサービス品質に影響をもたらす事象を重大なインシデントと規定している。重大なインシデントが確認された場合、要員招集し、インシデント対応チームを編成して組織的な対応を実施する。
 今回症状については、Bの設置台数約1000台が、影響を受ける重大なインシデントに該当する。
 私は、Z社技術部に所属するITサービスマネージャとして、今回症状のインシデント対応のチームに招集され、その活動を指揮することとなった。
2.2 発生した重大なインシデントの利害関係者
 私は、まず今回症状についての対策を検討するにあたって、利害関係者を確認することとした。
 今回症状については、顧客担当者、Z社技術部開発課の要員、Z社技術部サポート課の要員が該当する。
 この内、Z社技術部開発課の要員、及びZ社技術部サポート課の要員は内部メンバにあたる。そして、顧客担当者は、今回症状において直接影響を受けること、また外部に存在することから最も優先順位の高い利害関係者と言えるため、迅速で正確なコミュニケーションに最も留意しなければならない。
750-1550
設問イ
1.重大なインシデントへの対応手順の内容
 私は、設問アで述べた重大なインシデントの対応について、編成された対応チームを指揮する者として対応策を検討した。
 重大なインシデント対応については、Z社の規定された手順では、「対応する要員と十分な対策を検討したのち、さらに関係者に展開する」とされている。この為、私は開発課の要員と今回症状について確認した。今回症状では、一時的な処置としてサポート課による誘導による一部の設定変更で過検知を防ぐことが可能であり、この仮の処置(以下、ワークアラウンド対応という)実行後に、恒久的処置として、三日以内に今回症状に対応及びワークアラウンド対応を元に戻す改善された機能更新プログラムを配信することが可能であること(以下、今回対応という)を確認した。
 私は、この情報を元に、さらにサポート課の要員に展開した。
 Z社のサポートデスク対応の窓口は、主に電話を中心としている。この為、電話を受付けるサポート課のメンバーに、今回対応を周知徹底させ、顧客からの今回症状の入電時に説明ができるように、サポート課の要員に指示した。
2.利害関係者とのコミュニケーションについて
 Z社では、重大なインシデントの対応について、利害関係者とのコミュニケーションについて、インシデントの発生や解決に向けた対応の経過状況を正確かつ迅速に、適切な人員から適切な方法で通知することと規定している。私は、この規定を元に、以下のようにコミュニケーションの正確性と迅速性に留意した。
2.1 コミュケーションの正確性の観点について
 コミュニケーションの正確性については、今回症状について、経過状況により変更があった場合、過去に発信した情報に相違が発生する可能性があるため、内部メンバにおける情報発信、主に留意するよう手配した。また、顧客から連絡を受付けるサポート課に関しては、特に留意するよう指示した。
2.2 コミュニケーションの迅速性の観点について
 コミュニケーションの迅速性は、内部メンバにおいては、通常は口頭やEメールを利用するコミュニケーションをチャットを通じて内部メンバに通達することで迅速性を確保した。また、顧客への迅速性については、Z社ウェブページに掲載し、サポート受付の際にウェブページの確認を促した。
1718-2318
設問ウ
1.今回の重大なインシデントへのレビューにおける課題について
 今回症状に関しては、サポート課によるワークアラウンド対応と開発課による今回対応の配信が完了し、設置台数全台における対応が完了し、サービスが回復した。
 私は、今回症状のレビューを実施すると、検討したコミュニケーションのうち、Z社のウェブページのお知らせについて、が十分に機能されていないことを確認した。
 今回の「お詫びとお知らせ」と題したアクセス状況について確認すると、500回ほどのページビューの回数であった。進捗確認用に用意したページである為、本来であれば複数回見ることが予想されたが、この回数は顧客への進捗確認用として機能していないことが、考えられた。
 この為、顧客へのコミュニケーションのうち、インシデントの進捗確認についての課題が明らかになった。
 私は、以下の方法を改善策とした。
2.対応で明確になったコミュニケーションにおける改善策について
 今回のインシデント対応では、受付しワークアラウンド対応が終了した場合、その後の進捗状況については該当ウェブページの閲覧することを促した。これと合わせ、進捗連絡を必要と判断した顧客に対しては、アフターフォローとして、進捗の連絡をする。能動的に情報を発信することで、進捗確認に関して顧客へのコミュニケーションの不備がないようにした。
 これについては、インシデント対応を完了するのではなく、一時的な対応待ちとして処理するよう手配した。

この記事が気に入ったらサポートをしてみませんか?