Kernel-Panic

機器檢查異常導致的隨機重啟

  • July 3, 2015

我的筆記型電腦每天大約隨機重啟兩次。它在重新啟動之前顯示以下錯誤日誌。

錯誤日誌.

不幸的是,我不知道如何解碼機器檢查異常(MCE)。mcelog --ascii什麼都不輸出。有沒有可能這是一個軟體問題?

筆記型電腦是配備英特爾酷睿 i5-3317U 處理器的三星 NP900X3C。我使用帶有 3.13.5 核心的 Arch Linux。

這個問題與硬體故障有關,特別是它看起來像銀行 4 中的記憶體(DIMM 4 - 我會假設)有故障。MCE 設施(機器檢查事件)並不廣為人知,但我已經在網站上回答了幾個與之相關的問題。

此外,您可以在此 U&L Q&A 中為 MCE 編寫自己的規則,標題為: 為 mcelog 編寫觸發器

此外,如果您查看 MCE 的常見問題解答,第 6 項向您展示瞭如何使用mcelog --ascii命令,標題為:我如何“執行 mcelog –ascii”?. 基本上,您假設將恐慌消息保存在文本文件中,然後通過如下mcelog命令執行它:

$ mcelog --ascii < file

我怎樣才能解決這個問題?

選項1

你基本上有3個選擇。第一個我就不贅述了,就是更換插槽 4 中的 RAM DIMM。

選項 #2

第二種選擇是進一步診斷問題並確認它實際上是有故障的 DIMM。您可以使用memtest86+來執行此操作。除了執行此測試外,我還會花一分鐘時間重新安裝 DIMM,以確保它們在主機板上的插槽內接觸良好,如果您覺得這樣做很舒服的話。這樣做實際上很簡單。

選項#3

第三種選擇是嘗試將該位置列入黑名單,假設它與 DIMM 中的幾個特定地址隔離。信不信由你,您實際上可以將特定的記憶體地址列入黑名單。我還解釋瞭如何在這個站點上執行此操作,標題為:如何根據 MemTest86+ 錯誤指示將正確的壞 RAM 扇區列入黑名單?.

引用自:https://unix.stackexchange.com/questions/117449