Linux

ext4 : 壞塊修復了,但是這個磁碟快死了嗎?

  • October 6, 2017

Ubuntu 17.04;4TB WD 綠色 SATA 上的 ext4 文件系統

$$ WDC WD40EZRX-22SPEB0 $$ 掛載(在啟動時,從 fstab)失敗,超級塊錯誤。fsck 報告/inode 損壞,但已修復。99% 的文件已恢復(少數失去的文件可用於備份)。修復後的捲安裝並正常執行。

查看SMART數據,我認為磁碟還可以。“擴展的” smartctl 測試通過了。數據已經備份(並且不是關鍵任務)。我已經有一個替換驅動器。採取“零容忍”政策並立即更換磁碟是很誘人的,但因為它是一個 100 英鎊的物品,我不想扔掉一個搖搖晃晃的東西並將每個曾經寫過一次壞塊的磁碟裝箱。

這是 smartctl 轉儲。磁碟真的要死了,還是只是發生了一次性事故?

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       61
 3 Spin_Up_Time            0x0027   195   176   021    Pre-fail  Always       -       7225
 4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       770
 5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
 7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
 9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       12325
10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       730
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       40
193 Load_Cycle_Count        0x0032   194   194   000    Old_age   Always       -       18613
194 Temperature_Celsius     0x0022   121   106   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       21

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

根據 SMART 讀數,目前該磁碟似乎還不錯。

磁碟扇區令人興奮的是這些

  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -    0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -    0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -    0

重新分配的扇區是寫入失敗並在磁碟上重新映射到其他位置的扇區。其中少數是可以接受的。零是極好的。

目前未決扇區值是等待在別處重新分配的扇區數。(讀取失敗但磁碟正在等待寫入請求,這是重新映射扇區的點。)這可能會在一段時間內變為非零,並且隨著扇區被覆蓋,此數字將減少並且重新分配的扇區計數會增加。

離線不可糾正扇區的計數是失敗且無法重新映射的扇區數。非零值是壞消息,因為這意味著您正在失去數據。你的零值很好。

下一組顯示磁碟驅動器的使用持續時間

  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -    770
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -    12325
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -    730

您已經讓設備執行了 12325 小時(如果是連續時間,則大約是 18 個月),並且在此期間它已通電和斷電 730 次。如果您每天關閉它,那麼您已經讓磁碟在兩年內每天執行大約 16 小時。

最後,每周安排一次完整的測試是值得的。您可以使用諸如smartctl -t full /dev/sda. 測試中的錯誤可能會引起關注。

# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

如果您在 NAS 中使用它,我建議您使用 NAS 級磁碟。就個人而言,我發現 WD Red 在這方面非常出色。成本稍高,但保修期更長。

引用自:https://unix.stackexchange.com/questions/396442