“DegradedArray 事件”

January 9, 2017

我的 Raspi 上有一個 RAID 1，收到了我不明白的郵件，標題為“/dev/md0:my-host-name 上的 DegradedArray 事件”和“/dev/md0:my-host-name 上的失敗事件”。我收到了 6 條關於前者主題的消息和 2 條關於後者的消息。
第一種郵件如下所示：
這是在 my-host-name 上執行的 mdadm 自動生成的郵件消息
在 md 設備 /dev/md0 上檢測到 DegradedArray 事件。
忠實於你的，等等。
PS /proc/mdstat 文件目前包含以下內容：
個性：
$$ raid1 $$ md0 : 活躍的 raid1 sda1$$ 0 $$ 124967936塊超級1.2$$ 2/1 $$ $$ U_ $$ 點陣圖：1/1 頁$$ 4KB $$, 65536KB 塊未使用的設備：
第二種郵件是這樣的：
這是在 my-host-name 上執行的 mdadm 自動生成的郵件消息
在 md 設備 /dev/md0 上檢測到失敗事件。
它可能與組件設備 /dev/sdb1 有關。
忠實於你的，等等。
PS /proc/mdstat 文件目前包含以下內容：
個性：
$$ raid1 $$ md0 : 活動 raid1 sdb11(F) sda1$$ 0 $$ 124967936塊超級1.2$$ 2/1 $$ $$ U_ $$ 點陣圖：0/1 頁$$ 0KB $$, 65536KB 塊未使用的設備：
在了解這些消息之前，我重新啟動了我的 Raspi。這是目前的 RAID 狀態：
個性：
$$ raid1 $$ md0：活動raid1 sdb11 sda1$$ 0 $$ 124967936塊超級1.2$$ 2/2 $$ $$ UU $$ 點陣圖：0/1 頁$$ 0KB $$, 65536KB 塊未使用的設備：
事件發生時，我沒有碰過 Raspi 或其驅動器。但是，我不能排除其他人做了並且可能鬆開了其中一根數據線的連接。
這發生了嗎？是不是發生了別的事情？RAID 是否將自身恢復到正常操作，還是我必須做些什麼？
可能相關：安全資訊郵件的含義

第一條消息意味著您的 RAID 陣列進入了不一致的狀態，因為顯然sdb驅動器被檢測為失敗（第二條消息）。目前狀態看起來像陣列已恢復，但您可能需要檢查輸出smartctl --all /dev/sdb以獲取目前健康狀態（在驅動器參數和錯誤日誌之前列印）並檢查驅動器參數是否可疑（例如Reallocated Sector Count或Current Pending Sector提示潛在問題）或設備是否在錯誤日誌中有（新）條目。您可能還想檢查dmesg與相關的消息sdb。
為了更加安全，您還可以sdb1從 RAID 陣列中移除並在其上執行測試smartctl（例如smartctl -t short /dev/sdb，進行簡短測試或smartctl -t long /dev/sdb更徹底的測試）。
請注意，您需要使用-d <...>適合您設備smartctl的參數<...>。請參閱此受支持的 USB 設備列表以獲取正確的設備。要獲取 USB ID，您可以使用lsusb. 如果您的設備未列出，您可以查找相關設備（例如，由同一供應商提供或具有相似名稱）。

引用自：https://unix.stackexchange.com/questions/336068

“DegradedArray 事件”

相關問答

mdadm 軟體突襲問題

Btrfs 將較小的驅動器添加到 RAID1

CentOS 7 RAID 1 和虛擬機

如何在 RAID 1 模式下使用 BTRFS 將 Debian Jessie 正確安裝到多個設備上？

RAID 滯後突發寫入

使用 mdadm 修復兩個 RAID1 磁碟上失去的超級塊