Mdadm

RAID自動重新同步?

  • May 29, 2017

我相當隨機地檢查了我的 RAID 陣列的狀態,cat/proc/mdstat並意識到我的一個陣列似乎正在重新同步:

md1 : active raid1 sdb7[1] sdc7[0]
     238340224 blocks [2/2] [UU]
     [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

為什麼會這樣,這是什麼意思?我似乎可以通過權限訪問掛載點r/w

編輯 1(響應SLM 的 ANSWER

如果我grep通過dmesg並且--detail開關也沒有告訴我太多資訊,我真的看不到任何東西,即它顯示重新同步正在進行中……但沒有提示原因或它可能不同步的原因…… . - 我想我可能只需要在開始更換硬體之前密切關注它。

這似乎表明 RAID 的 2 個成員之間的同步沒有保持彼此同步。

1.調查日誌

我會調查您的dmesg日誌,看看是否有任何消息表明組成此陣列的物理 HDD 出現硬體故障。

2.檢查mdadm

您還可以mdadm使用--detail開關進行諮詢,以了解有關重新同步的更多資訊,如下所示:

$ sudo mdadm --detail /dev/md0
/dev/md0:
       Version : 00.90.03
 Creation Time : Sat Jan 26 09:14:11 2008
    Raid Level : raid1
    Array Size : 976759936 (931.51 GiB 1000.20 GB)
 Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
  Raid Devices : 2
 Total Devices : 2
Preferred Minor : 0
   Persistence : Superblock is persistent

   Update Time : Fri Jan  1 01:29:16 2010
         State : clean, resyncing
Active Devices : 2
Working Devices : 2
Failed Devices : 0
 Spare Devices : 0

Rebuild Status : 50% complete

          UUID : 37a3bfcb:41393031:23c133e6:3b879f08
        Events : 0.2178969

   Number   Major   Minor   RaidDevice State
      0       8        1        0      active sync   /dev/sda1
      1       8       17        1      active sync   /dev/sdb1

如果兩個設備看起來都很好並且您無法確定哪個設備存在問題,您可能需要針對每個 HDD 臨時執行一個診斷工具,例如 HDAT2 或 SpinRite,以確認它們的健康狀況。

3. 佈線

如果 HDD 檢查出來,那麼我會開始檢查電纜,我通常會將它們換掉。

4.控制器

接下來我會仔細檢查控制器本身,要麼將驅動器從受影響的系統中取出並在輔助系統中進行診斷,要麼將第 3 方控制器卡添加到受影響的系統中以進一步診斷問題。

5.電源

信不信由你,我過去曾遇到過 HDD 和 RAID 問題,在這些問題中,更換故障或即將故障的電源解決了我的 RAID 健康問題。

引用自:https://unix.stackexchange.com/questions/153243