Linux
如何在 Linux 中監控 Ivy Bridge Xeon E3 處理器上的 RAM ECC 錯誤?
我如何監控 RAM 中是否有任何被 ECC 糾正的錯誤?處理器是 Intel Xeon (Ivy Bridge) 處理器,作業系統是 Scientific Linux 6.3。在以前的系統上,我有一個 AMD CPU,在那個系統上,我可以使用 edac-util 獲取此資訊,它還會向核心日誌發出警報。
至於我發現 sb_edac 模組僅支持 E5 Xeons
從 Linux 核心 3.17 版開始,可以使用此送出
ie31200_edac
引入的驅動程序監控 E3 Xeons 上的 ECC 錯誤。這使用標準 EDAC 介面,因此可以使用 列出錯誤。edac-util
更詳細一點:
sudo modprobe ie31200-edac
載入驅動程序,這將導致類似的行
[ 14.635299] EDAC MC: Ver: 3.0.0 [ 14.637898] EDAC MC0: Giving out device to module ie31200_edac controller IE31200: DEV 0000:00:00.0 (POLLED)
出現在核心日誌中(在 C216 Haswell 系統上);然後
edac-util
將報告任何錯誤。
sb_edac
使用orskx_edac
模組支持 Xeon D、E5 和 E7 記憶體控制器。