Mdadm
RAID自動重新同步?
我相當隨機地檢查了我的 RAID 陣列的狀態,
cat/proc/mdstat
並意識到我的一個陣列似乎正在重新同步:md1 : active raid1 sdb7[1] sdc7[0] 238340224 blocks [2/2] [UU] [==========>..........] resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec
為什麼會這樣,這是什麼意思?我似乎可以通過權限訪問掛載點
r/w
。編輯 1(響應SLM 的 ANSWER)
如果我
grep
通過dmesg
並且--detail
開關也沒有告訴我太多資訊,我真的看不到任何東西,即它顯示重新同步正在進行中……但沒有提示原因或它可能不同步的原因…… . - 我想我可能只需要在開始更換硬體之前密切關注它。
這似乎表明 RAID 的 2 個成員之間的同步沒有保持彼此同步。
1.調查日誌
我會調查您的
dmesg
日誌,看看是否有任何消息表明組成此陣列的物理 HDD 出現硬體故障。2.檢查mdadm
您還可以
mdadm
使用--detail
開關進行諮詢,以了解有關重新同步的更多資訊,如下所示:$ sudo mdadm --detail /dev/md0 /dev/md0: Version : 00.90.03 Creation Time : Sat Jan 26 09:14:11 2008 Raid Level : raid1 Array Size : 976759936 (931.51 GiB 1000.20 GB) Used Dev Size : 976759936 (931.51 GiB 1000.20 GB) Raid Devices : 2 Total Devices : 2 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Fri Jan 1 01:29:16 2010 State : clean, resyncing Active Devices : 2 Working Devices : 2 Failed Devices : 0 Spare Devices : 0 Rebuild Status : 50% complete UUID : 37a3bfcb:41393031:23c133e6:3b879f08 Events : 0.2178969 Number Major Minor RaidDevice State 0 8 1 0 active sync /dev/sda1 1 8 17 1 active sync /dev/sdb1
如果兩個設備看起來都很好並且您無法確定哪個設備存在問題,您可能需要針對每個 HDD 臨時執行一個診斷工具,例如 HDAT2 或 SpinRite,以確認它們的健康狀況。
3. 佈線
如果 HDD 檢查出來,那麼我會開始檢查電纜,我通常會將它們換掉。
4.控制器
接下來我會仔細檢查控制器本身,要麼將驅動器從受影響的系統中取出並在輔助系統中進行診斷,要麼將第 3 方控制器卡添加到受影響的系統中以進一步診斷問題。
5.電源
信不信由你,我過去曾遇到過 HDD 和 RAID 問題,在這些問題中,更換故障或即將故障的電源解決了我的 RAID 健康問題。