見出し画像

KDDI通信障害

7月2日の未明から続いたKDDIのau携帯電話サービス(UQ mobile含む、以下au)の大規模通信障害。
これまでごく普通に利用していたスマホが突然使えなくなった。

原因と対応についてまとめてみる


■原因

①コアルーターの経路変更時、VoLTEが普通になった
②経路変更作業を中断を判断し、メンテ前に切り戻しを行った
③切り戻し後のアクセス集中により輻輳が発生し、通信障害が拡大!
④ネットワーク機器のゲートウェイにリセットをかける


発生時刻

7/2 1:35

顧客への影響

  • 携帯電話の通話ができない

  • 緊急通報も不可

  • SMSが使えない

  • MVNO回線や、一部エリアでKDDIの回線を使う楽天モバイルも影響を受けた。

  • スマホや専用端末を業務に使っている人の業務が滞った


月一で行うメンテナンスの一環として、KDDIネットワークのモバイルコア・ネットワークへと中継するコアルーターのうち1つを、旧製品から新製品に切り替え作業をしていた。その最中に起きた。

携帯電話網には、その番号がどのような契約の伴うものであるかを記録した「加入者DB」がある。VoKTE交換機で輻輳が起きた結果、加入者DBに正しい情報が書き込めなくなり、データベースの不一致が発生した。

データベースの不一致で何が起こるか。
多くの人の通信・通話が正しく行えなくなる。
そのまま不可増大による輻輳を放置するとさらに大変な事態になる。
そこで、VoLTE交換機の負荷軽減を目的とし、意図的に「流量制御」をはじめた。結果データ通信が行いづらくなった。


3日0時までは、業況報告のみの復旧目途の情報もない告知が続いた。
初動対応については反省すべきところがあるという。
3日午前3時のアナウンスで初めて、復旧率の数字が含まれる


再発防止策

総務省は今回の障害について、重大な事故にあたるとしている。
KDDIは総務省に対し、発生から30日以内に詳細な報告を行う必要がある。




よろしければサポートをお願いします!今後の活動費として利用させていただきます。