主 GPT 表損壞(RAID-1 並安裝為 /home)阻止我重新安裝 Linux
環境:
Linux TRANQUILITY 5.3.18-150300.59.49-preempt #1 SMP PREEMPT Mon Feb 7 14:40:20 UTC 2022 (77d9d02) x86_64 x86_64 x86_64 GNU/Linux
還有 OpenSuse Leap 15.3 和 KDE Plasma 5當我從 USB 記憶棒執行作業系統安裝時,我得到了分區檢查,它在哪裡爆炸:
/usr/bin/udevadm /dev/sdd1 could not be found (failed)
- (我不記得確切的錯誤文本,沒有重新執行安裝過程,但這是要點它)去年(2021 年 4 月)我在失去
/home
數據時遇到問題,不得不將非 RAID 磁碟帶到數據恢復公司。從記憶中,我認為它原來是一個 GPT 錯誤,修復它只是昂貴而不是天文數字(很高興為我的數據安全付費)。我讓他們將所有/home
數據從該磁碟傳輸到我購買的兩個 1TB WD Black 磁碟之一。我用兩個新磁碟設置了 RAID-1,直到最近這似乎都很好。奇怪的事情發生了,我不知道它們是否相關,但它們看起來很系統 - 比如:
- Firefox 標籤在某些網站上立即開始崩潰,我認為/認為這可能是 Firefox 錯誤
- Python 停止工作,導致不相關的程序失敗(主要是 Libre-Office - 不斷進入恢復),但 FreeCAD(主要基於 Python)仍然有效
- Corel AftershotPro 由於缺少/不正確的版本庫(仍然存在)而無法啟動
我嘗試的許多修復似乎又回到了 Python。最後,我刪除了 Python,它解除安裝了許多關鍵作業系統的東西(尤其是 GUI),然後我重新安裝了它(以及大多數已自動解除安裝的項目。即使這樣也沒有用,所以我想我’會重新安裝作業系統-認為我的
/home
數據是安全的。正如我所提到的,情況似乎並非如此,它正在停止重新安裝以穩定我的電腦。lsblk <snipped the loop devices> sda 8:0 0 931.5G 0 disk └─sda1 8:1 0 931.5G 0 part └─md127 9:127 0 931.5G 0 raid1 └─md127p1 259:0 0 931.5G 0 part /home sdb 8:16 0 1.8T 0 disk └─sdb1 8:17 0 1.8T 0 part └─cr-auto-1 254:0 0 1.8T 0 crypt /china2 sdc 8:32 0 111.8G 0 disk ├─sdc1 8:33 0 148M 0 part ├─sdc2 8:34 0 100G 0 part / ├─sdc3 8:35 0 2G 0 part └─sdc4 8:36 0 2G 0 part sdd 8:48 0 931.5G 0 disk sde 8:64 0 1.8T 0 disk └─sde1 8:65 0 1.8T 0 part /chinaPhotos
注意
sda/sda1/md127/md127p1
在這里安裝為/home
我猜
sda
&sdd
是有貢獻的物理RAID設備,sdd
是壞的嗎?我嘗試了以下方法:(顯示
/home
的是/dev/md127p1
)df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 4.0M 0 4.0M 0% /dev tmpfs 7.8G 243M 7.5G 4% /dev/shm tmpfs 3.1G 335M 2.8G 11% /run tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup /dev/sdc2 100G 38G 63G 38% / /dev/sdc2 100G 38G 63G 38% /.snapshots /dev/sdc2 100G 38G 63G 38% /boot/grub2/i386-pc /dev/sdc2 100G 38G 63G 38% /boot/grub2/x86_64-efi /dev/sdc2 100G 38G 63G 38% /opt /dev/sdc2 100G 38G 63G 38% /root /dev/sdc2 100G 38G 63G 38% /srv /dev/sdc2 100G 38G 63G 38% /tmp /dev/sdc2 100G 38G 63G 38% /var /dev/sdc2 100G 38G 63G 38% /usr/local /dev/sdb1 1.8T 1.7T 94G 95% /chinaPhotos /dev/md127p1 932G 402G 530G 44% /home <snipped loop devices> /dev/mapper/cr-auto-1 1.9T 1.5T 399G 79% /china2 tmpfs 1.6G 72K 1.6G 1% /run/user/1000 /dev/sdm 3.4M 3.3M 116K 97% /run/media/░░░░/SBEAM /dev/sdn 1.6M 24K 1.6M 2% /run/media/░░░░/UPDATE 192.168.░░░.░░░:/volume1/DataBackup 2.7T 2.3T 492G 83% /░░░░░ <snipped loop devices>
最後,我試過了
mdadm --detail /dev/md* mdadm: /dev/md does not appear to be an md device /dev/md127: Version : 1.0 Creation Time : Sun Apr 25 17:58:55 2021 Raid Level : raid1 Array Size : 976761344 (931.51 GiB 1000.20 GB) Used Dev Size : 976761344 (931.51 GiB 1000.20 GB) Raid Devices : 2 Total Devices : 1 Persistence : Superblock is persistent Intent Bitmap : Internal Update Time : Sun Mar 6 19:26:29 2022 State : clean, degraded Active Devices : 1 Working Devices : 1 Failed Devices : 0 Spare Devices : 0 Consistency Policy : bitmap Name : any:home UUID : 75959fa2:f25b6088:7a9e9a80:c1f38480 Events : 3183874 Number Major Minor RaidDevice State 0 8 1 0 active sync /dev/sda1 - 0 0 1 removed /dev/md127p1: Version : 1.0 Creation Time : Sun Apr 25 17:58:55 2021 Raid Level : raid1 Array Size : 976760303 (931.51 GiB 1000.20 GB) Used Dev Size : 976761344 (931.51 GiB 1000.20 GB) Raid Devices : 2 Total Devices : 1 Persistence : Superblock is persistent Intent Bitmap : Internal Update Time : Sun Mar 6 19:26:29 2022 State : clean, degraded Active Devices : 1 Working Devices : 1 Failed Devices : 0 Spare Devices : 0 Consistency Policy : bitmap Name : any:home UUID : 75959fa2:f25b6088:7a9e9a80:c1f38480 Events : 3183874 Number Major Minor RaidDevice State 0 8 1 0 active sync /dev/sda1 - 0 0 1 removed
安裝過程辨識
/dev/sdd
為問題,但似乎與以下問題相同fdisk
。fdisk /dev/sdd Welcome to fdisk (util-linux 2.36.2). Changes will remain in memory only, until you decide to write them. Be careful before using the write command. The primary GPT table is corrupt, but the backup appears OK, so that will be used.
和
fdisk /dev/sda Welcome to fdisk (util-linux 2.36.2). Changes will remain in memory only, until you decide to write them. Be careful before using the write command. Command (m for help): v No errors detected. Header version: 1.0 Using 1 out of 128 partitions. A total of 2014 free sectors is available in 1 segment.
電腦大部分工作正常,我已經備份了 /home 的大部分數據,但更新正在備份,我無法安全地重新安裝。
在硬體方面,依次物理移除每個 RAID 磁碟(首先關閉 PC,obvs) - 其中一個磁碟對啟動沒有影響(所有工作都在重新啟動)但移除另一個會停止啟動過程,所以我猜第二個是工作 RAID
/dev/sda
-/home
磁碟,前者是“損壞”的磁碟/dev/sdd
!我還嘗試將壞掉的那根換成正在工作的那根 SATA 電纜,以防萬一那是問題,但沒辦法!我可以執行哪些進一步的診斷/操作來查看是否:
- 我關於那個磁碟有問題的假設是正確的
- 找出問題所在
- 格式化它或以其他方式恢復它並將其添加回 RAID1 陣列(或者我應該更換它嗎?)
GPT 錯誤非常輕微,您可以忽略它。看來您昨天從陣列中刪除了 sdd 。執行
mdadm -E /dev/sdd1
並將其輸出添加到您的問題中。希望它仍然可以看到該驅動器上的 raid 元數據並確認它最近已被刪除,在這種情況下,您可以mdadm --re-add
將其放回陣列中。不過,在將其添加回陣列之前,您可以使用
smartctl -a /dev/sdd
.至於其他奇怪的症狀,您可能需要執行 memtest86 來檢查您的記憶體。