H28 SM PM2-2 プロセスの不備について

15:33

設問ア:ITサービスの概要と、不備があったプロセスの概要と不備の内容について


1.携わったITサービスの概要
 Z社は、自社開発のネットワーク機器を販売する通信事業者である。Z社では、受付からサポート及びインシデント対応(以下、サポート対応という)までをZ社技術部サポート課にて対応している。Z社技術部管理課では、これらのサポート対応についての品質管理を実施している。Z社開発課は、Z社のネットワーク機器を開発し、このネットワーク機器のサポート対応について高度な対応についての取り扱いについての対応を手助けする機能的エスカレーションの対応先としても機能する。
2.不備があったプロセスの概要及び不備の内容について
 私は、技術部管理課に所属し、週次でサポート対応についての品質を管理するITサービスマネージャである。
 私が週次で確認する数値の一つに障害発生数がある。この数値が今回確認した数値が、今年度で最も大きく通常週平均1000件であったが1100件であった。
 この増加した100件をさらに詳細に確認すると、同様なインシデント発生していることが確認された。それはZ社の開発したセキュリティルータのBに関わるものであった。特定の条件下でCPU使用率が100%を推移し、設置環境の通信状況に一時的な不調をもたらすものであり、Bの通信の過検知がもたらすもの(以下、今回障害という)であった。
 この症状のサポート対応を確認すると、検知の一時的に無効化しすぐに有効化することで症状が治まることが判明した。
 私は、開発課にこの事象について確認すると、現象は確認されていて、次回の機能更新を目途に対応することが確認された。
 私は、繰り返されるインシデントの対応についてを管理する問題管理プロセスに不備があり、このBに関するインシデントの発生及び週次における障害発生数の増加につながったものと考えた。
752-1552

設問イ:プロセスの不備の調査と対策


1.不備の調査
 私は、設問アで述べた、問題に対し調査を開始した。
 技術部及び開発課の要員から聞き取り調査によって、以下の事実が判明した。
 ①技術部のサポート対応において、今回障害の対応時に個別に開発課に問い合わせていること。
 ②開発課の対応指示に基づき、サポート対応を完了していること。
 私は、この問題がインシデント対応が技術部のワークアラウンドの対応に留まり、管理課で実施されるべき問題管理、具体的には共有すべき情報が不足し根本解決及び問題解決プロセスへと発展していないと考えた。
2.不備の対策
 私は、上記の調査で得た知見から、二つの対策を検討した。
2.1検討した一番目の対策について
 私が検討した対応策は、技術部から開発課への個別の問合せを禁止することである。この個別の問合せの替わりに、管理課数人を窓口として配置する。この対策により、今回のように週次における管理ではなく、日次における今回障害のようなインシデントの対応における検知及び対応の粒度が細くなることが期待される。
2.2検討した二番目の対策について
私が検討した二番目の対応策は、定期的あるいは非定期的な技術部、管理課及び開発課の要員によるミーティングの開催である。今回対応では、情報提供や情報の共有といった連携するタイミングの悪さが確認された。これを防ぐため、月次の定期的なミーティングを開催する。また、上記の管理課による窓口を経由することで今回対応のような場合を早期に検知できた場合、緊急で開催されることも予想されるからである
3.工夫した点
 私が上記の対策について工夫した点は、チャット機能を利用した点である。これは、Z社が開発したチャット機能のアプリケーションで、各メンバーを追加するグループチャット機能がある。私は、このグループチャットに技術部、管理課、及び開発課の要員を参加したグループを作成した。また、技術部のサポート対応を実施する全員と管理課の窓口対応を実施する要員でグループを作成し、情報発信を迅速に行えるよう手配した。
1614-2214

設問ウ:プロセスの不備に関連して行った、事前予防的な活動について


1.インシデント対応について
 私は、設問イで述べた対策を実施し、今回障害に対処した。この結果、問題解決プロセスとして、今回障害の一時的な対応をグループチャットを利用し技術部要員に通達することが可能となった。また、開発課による機能更新の根本解決の進捗やスケジュールの通達を実施することで問題解決プロセスの不備を解消することが可能となった。
2.事前予防的な活動について
 私は、今回対応が完了し、今回対応で発見された発見された問題管理プロセスの不備に起因するインシデントの傾向分析が必要と考えた。
 今回対応では、週次の管理指標により発見されたが、今後のインシデントの傾向分析では日次的なインシデントの兆候を捉える必要がある。
 この点については、二点の対応を検討した。
 一点目は、日次におけるインシデントの兆候、具体的には前月度の平均と比較しての増加を自動で検知し管理課要員に通知する。これは、週次のインシデント対応の指標管理を日時の指標管理にすることは管理工程の作業が複雑になる為、これを簡略化するためである。
 二点目は、上記のインシデントの兆候が見られた際に、グループチャット機能を利用し、各関係者に早期に通達することである。これはインシデント対応に関する要員であるサポート対応者やや開発課の要員に通達し、管理課のインシデント対応管理から問題管理プロセスまでのプロセスの不備、特にプロセス間の連携の問題に対応する為である。
以上
18:01

この記事が気に入ったらサポートをしてみませんか?