SSD 搞砸了 - 不知道如何在 Linux 上修復它
我被我的上網本(Dell Latitude 3380)困住了。用了一年:效果很好。我購買並安裝了新的 SSD,在其上安裝了 Kubuntu 18.04。幾個小時後效果很好。然後當我從外部硬碟複製文件並做一些事情時它就凍結了。然後它工作得非常慢,所以我想試試 19.04。現在,我猜,是一個大錯誤:我手動更改了分區表。以前有一個 ext4 分區掛載為 /,第二個掛載為 /home 和交換。我刪除了第一個,一開始創建了200MB的EFI,其餘的再次格式化為ext4,/。我離開 /home 並在沒有格式化的情況下交換。
系統安裝沒有錯誤或警告,但重新啟動後只有 grub 救援。我可以用它從 Live USB 啟動 linux(這就是我寫這個的方式)——所以模組文件在那裡並且可以讀取。(當然,我可以通過 BIOS 直接從 USB 啟動)。GRUB 會看到此磁碟上的分區。/dev/sda1(EFI 分區)設置為 BOOT,但係統本身和 GRUB 文件位於 /dev/sda7。我想這是個問題。
但是,任何從 Ubuntu Live 或 System Rescue CD Live 在我的 /dev/sda 上使用 gparted、fdisk、wifefs 或 fsck 的嘗試都會以奇怪的錯誤結束。每兩分鐘我就會收到如下消息:
INFO: task fsck.ext2:6081 blocked for more than 120 seconds. Not tainted 4.19.34-1-lts #1
ctrl+c 沒有幫助。我必須進行硬重置。Kubuntu 安裝程序給了我這樣的錯誤消息,
"/dev/sda1/" cannot be accessed
所以我無法繼續進行時區設置。我的 BIOS 有一個擦除內部磁碟的選項。我執行它,但它以錯誤結束並且沒有詳細資訊。我做了dd if=/dev/zero of=/dev/sda
並一夜之間離開了電腦。工作沒有錯誤,寫了大約 512GB 的零,但沒有真正改變;P 分區仍然存在,正如我從 grub 救援中看到的那樣。我能夠執行一次 fdisk-l 並看到分區表。然後我嘗試了 fsck /dev/sda 並再次產生“未污染”的情況。
這是怎麼回事?這是一個有故障的SSD嗎?似乎不是,因為在我第一次安裝時,我能夠正常使用它。SMART 也沒有顯示錯誤。顯然,我不在乎磁碟上的任何數據。我只想做任何事情來全新安裝新的 Kubuntu(或 Mint 或其他)。
這是
blkid
輸出:/dev/sda1: UUID="D66B-BF6C" TYPE="vfat" PARTUUID="b9d3b90b-01" /dev/sda5: UUID="eec4f953-b9ba-4579-95f4-8f9a8d6821a3" TYPE="ext4" PARTUUID="b9d3b90b-05" /dev/sda7: UUID="8b9d60f7-fa03-459a-9d34-784d4259338a" TYPE="ext4" PARTUUID="b9d3b90b-07"
一些附加資訊:我的上網本在 Kubuntu 16.04 上執行了一年,除了偶爾因為一些 I/O 錯誤而掛起,消息還包含硬碟的扇區號。(如果您認為相關,我可以提供更詳細的說明)
我的新 SSD 是 Goodram CX400 512GB。
每當我使用 Kubuntu 18.04、19.04、Mint 19.1 或 Fedora 30 KDE 啟動 USB 時,我都會看到這樣的消息(在 Kubuntu 16.04 上沒有看到):
May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 6: ee2000000040110a May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1ce80 MISC 43880014086 May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: Machine check events logged May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 7: ee2000000040110a May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR fef1cec0 MISC 47880014086 May 28 06:38:22 kubuntu kernel: mce: [Hardware Error]: PROCESSOR 0:806e9 TIME 1559025486 SOCKET 0 APIC 0 microcode 9a
我發現有人在戴爾筆記型電腦上遇到類似問題,並聲稱這些是誤報(範例 1、範例 2)。
幾次通過後的 Memtest 根本不會產生任何錯誤。
由於所有寫入操作都失敗並且數據被保留,因此聽起來好像驅動器已將自身設置為只讀,可能是由於錯誤條件(過熱、電源浪涌等)造成的。
郵寄製造商技術支持並解釋問題。他們可能會幫助修復/重置或可能更換驅動器。