WHEA_UNCORRECTABLE_ERRORの対応録


最初に結論

原因はCPUの故障だった

以下、原因を特定するまでの流れを記載する。同じエラーで困っている人は、筆者が実行したトラブルシューティングと同様のプロセスを踏むことで解決出来るかもしれない

※筆者には人の金でPCを組む趣味があり、今回のPCも依頼されて組んだものだ

時系列順に整理

4/26 組んだPCを依頼者に送る

ビカビカにしてくれと言われたので要望通りに
2024/3/1時点の価格 BTOだと安くても35万を超えてくる


6/11 深夜 依頼者からDM

突如ブルスクを吐き、再起動ループに陥ったとのこと
エラーコードは WHEA UNCORRECTABLE ERROR

  • 周辺機器を全て外し再起動(儀式)

  • スタートアップ修復を試してもらうも、実行不可。その後セーフモードで起動出来たため、データの退避を推奨するも数分後に再びBSoD

  • BIOS画面でメモリや電圧が正常であることは確認

ここで眠気が限界を迎えたため、再度セーフモードでのデータ退避を試みてもらうことに

6/11 午後 

結局ブートループになってしまったそうで、スタートアップ修復からコマンドプロンプトを開き、chkdskDISM.exe及びsfc /scannowを実施してもらうも改善せず
初期化も試みたものの、再びWHEAエラーを吐いたため修理依頼を受諾

ちなみに、依頼者は既にマザーボードの初期不良でメモリスロット故障を引き当てているためお祓いをオススメしておいた

6/14 PCが到着

まずはメモリの挿し直し、GPUの挿し直し、各プラグの挿し直し、GPUのドライバアップデート、BIOSアップデートを試したものの、いずれも起動後数秒~数分でWHEAエラーを吐いた。セーフモードも機能せず
この時点ではメモリの問題を疑い、コマンドプロンプトからメモリ診断(mdsched)を実施してみたところセーフモードでの起動はある程度安定するようになった

筆者だけでは原因の切り分けが難しいと判断し、日付が変わった深夜1時でもオンラインだったフレンドAを招集。フレンドAからCPUの熱暴走を提唱されたため、BIOSからCPUファン速度を100%にして起動を試みるもやはり起動後数分でWHEAエラー。BSoD直前のタスクマネージャーからも異常な高温は認められなかった

作業中にフレンドAがSSD交換でWHEAエラーが改善した記事を見つけたため、筆者PCのSSDを依頼者のPCに挿して起動してみることに。「組んでから2ヶ月も経ってるから初期不良じゃねぇよな~」「作業的に一番面倒なのは電源が原因だった場合 (配線を全て外す必要があるため)だけど、電圧降下してないから違うよな~」という話をしつつ交換作業を終えて起動すると、先ほどとは一転して安定動作するようになった。しかし、試しにFF14ベンチマークを回してみたところ2/5ほど走った辺りで再びWHEAエラーを吐いた

ここで暇をしていたフレンドBが合流したが、雑談要員が増えただけ
イベントビューアーを確認したところ、BSoD直前にintel Rapid Storage Technology (ストレージ関連サービス)でエラーが発生していた。これとSSD交換で症状が変わらないことを踏まえると、M.2スロットに問題が…?
Micro-ATX規格のマザボはメモリスロット×2、M.2スロット×1のことが多いが、筆者は冗長性のために必ずM.2スロットが2つ以上あるマザボを選ぶ。これが幸いし、当該マザボには2つ目のスロットが存在するためそこに挿してみることに

SSD3枚構成で冗長性の塊な筆者PC

すると、FF14ベンチマークを問題無く完走出来るほどに改善した。依頼者のSSDに戻して試してもベンチマークは完走出来た
スロット2はスロット1 (Gen4×4)と異なりGen3×4のためパフォーマンスは落ちるが、普段使いでは実感出来る差が無い。そのため、一旦依頼者にこのまま返却するか否かを確認することにしたが、念の為回していたベンチマーク3周目でWHEAエラーを吐いたため絶望。逆にintel RSTでのエラーは一体何だったのか

依頼者のSSDに問題がある可能性を考え、筆者側でも初期化を実施してみることに。Win11のインストールメディアの作成にやたら時間がかかったため、原神をしながら待機

原神における元素反応

原神ミリ知らのフレンドBに元素反応の説明が終わり、フレンドAが寝落ちした辺りでメディアの作成が完了したためインストール作業を行なうも、作業中にWHEAエラーを吐いたためキレながら就寝 (午前5時)

6/15 午後

CMOSクリアを試していないことを思い出したため試してみたものの、「この画面が壁紙です」と言わんばかりのWHEAエラー

残された原因はCPUくらいしか無かったため、面倒ながらも筆者PCのCPUとの交換を実行することに。筆者PCのCPUは14600KF, 依頼者PCのCPUも同じく14600KFだったため幸いにもこの手段をとることが出来た。この前に組んだPCはRyzenなのでこの手段は通用しない。そう思うと本当にラッキーだった

結果は冒頭にもあるようにCPUが原因で、すこぶる快調に動作した。intel CPUは3年間の保証が標準でついているためSWR( Standard Warranty Replacement)をリクエスト。土曜日なので回答は週明けとなる

6/17 午後

intelサポートから返信があり、SWRを承認したので着払いで送れとのこと。依頼者はFF14の大型拡張アーリーアクセス (6/28)前の返却を希望しているが、ギリギリ間に合いそう

6,7営業日ほどで代替品が送られて来るらしい

トラブルシューティングを完走した感想

まずもって何故2ヶ月近く経ってから故障が発生したのかが謎。通常、初期不良は使用開始から2~3週間で発生する確率が高く、それ以降は低下していく。ハズレを引いたと言えばそれまでだが
また、最近話題になっているintel CPUが劣化する不具合はi7ないしi9でOCしている場合に発生するもので、冷却性を意識したi5ごときで発生はしない。そもそもB760でCPU OCは不可能だ
一番最初にCPUを疑えなかったのはメモリ診断で動作が一時的に改善したこと、SSDを交換したら何故か動作が安定したこと、CPUはトラブルが起きにくいパーツであること、シンプルにCPUの交換が面倒だったことが挙げられる

以上、WHEAエラーに対する対応録となる。いつどんな問題が発生しても良いように復元ポイントの作成とバックアップは取ろう


追記

6/19 夕方

intelサポートからCPUを受け取ったとの連絡があった数分後、交換品を発送したとの連絡があった

あまりにも早い発送

何故こんなにも爆速発送だったのか不思議に思ったが、これに前後してintelから発表があり、i5ごときも一連の高負荷時劣化問題の対象に含めるとのこと

後出しが過ぎるだろうがふざけるな

2ヶ月で発症したのは少々早い気もするが、同じCPUを使う筆者はCPUに負荷がかかるゲームをあまりしないのに加え、元々PL2を188Wから若干落としていたこと、対して依頼者は様々なゲームをしながら配信もよく行ない、ゲームの複数起動もしていたことを考慮すると、十中八九この問題に当たったという認識で良いだろう。どう考えても到着した瞬間に不具合の確認もせず光速返送したであろう対応も、件の問題として処理されたとすれば納得がいく

崇高なる天下のintel様におかれましては、恐れながらも一刻も早く対象CPU欠陥商品優良誤認違法販売風情が
にリコールをかけるべきだということをご推奨いたしますさっさとリコールしろやボケカスが

かなり早く届いたため大型拡張前に依頼者へと返送することが出来たものの、当該マザボではPL1/PL2の変更が出来なかったため不安が残る。7月中旬頃のeTVB対応BIOSアップデート頒布時に遠隔サポートしながらIntel Default Settingsを適用してもらうしかない… (一般人にBIOSアプデをさせるのはとてつもなくハードルが高いがやむを得ない)

この記事が気に入ったらサポートをしてみませんか?