Raid

“DegradedArray 事件”

  • January 9, 2017

我的 Raspi 上有一個 RAID 1,收到了我不明白的郵件,標題為“/dev/md0:my-host-name 上的 DegradedArray 事件”和“/dev/md0:my-host-name 上的失敗事件”。我收到了 6 條關於前者主題的消息和 2 條關於後者的消息。

第一種郵件如下所示:

這是在 my-host-name 上執行的 mdadm 自動生成的郵件消息

在 md 設備 /dev/md0 上檢測到 DegradedArray 事件。

忠實於你的,等等。

PS /proc/mdstat 文件目前包含以下內容:

個性:

$$ raid1 $$ md0 : 活躍的 raid1 sda1$$ 0 $$ 124967936塊超級1.2$$ 2/1 $$ $$ U_ $$ 點陣圖:1/1 頁$$ 4KB $$, 65536KB 塊 未使用的設備:

第二種郵件是這樣的:

這是在 my-host-name 上執行的 mdadm 自動生成的郵件消息

在 md 設備 /dev/md0 上檢測到失敗事件。

它可能與組件設備 /dev/sdb1 有關。

忠實於你的,等等。

PS /proc/mdstat 文件目前包含以下內容:

個性:

$$ raid1 $$ md0 : 活動 raid1 sdb11(F) sda1$$ 0 $$ 124967936塊超級1.2$$ 2/1 $$ $$ U_ $$ 點陣圖:0/1 頁$$ 0KB $$, 65536KB 塊 未使用的設備:

在了解這些消息之前,我重新啟動了我的 Raspi。這是目前的 RAID 狀態:

個性:

$$ raid1 $$ md0:活動raid1 sdb11 sda1$$ 0 $$ 124967936塊超級1.2$$ 2/2 $$ $$ UU $$ 點陣圖:0/1 頁$$ 0KB $$, 65536KB 塊 未使用的設備:

事件發生時,我沒有碰過 Raspi 或其驅動器。但是,我不能排除其他人做了並且可能鬆開了其中一根數據線的連接。

這發生了嗎?是不是發生了別的事情?RAID 是否將自身恢復到正常操作,還是我必須做些什麼?

可能相關:安全資訊郵件的含義

第一條消息意味著您的 RAID 陣列進入了不一致的狀態,因為顯然sdb驅動器被檢測為失敗(第二條消息)。目前狀態看起來像陣列已恢復,但您可能需要檢查輸出smartctl --all /dev/sdb以獲取目前健康狀態(在驅動器參數和錯誤日誌之前列印)並檢查驅動器參數是否可疑(例如Reallocated Sector CountCurrent Pending Sector提示潛在問題)或設備是否在錯誤日誌中有(新)條目。您可能還想檢查dmesg與 相關的消息sdb

為了更加安全,您還可以sdb1從 RAID 陣列中移除並在其上執行測試smartctl(例如smartctl -t short /dev/sdb,進行簡短測試或smartctl -t long /dev/sdb更徹底的測試)。

請注意,您需要使用-d <...>適合您設備smartctl的參數<...>。請參閱此受支持的 USB 設備列表以獲取正確的設備。要獲取 USB ID,您可以使用lsusb. 如果您的設備未列出,您可以查找相關設備(例如,由同一供應商提供或具有相似名稱)。

引用自:https://unix.stackexchange.com/questions/336068