Drivers

B460 主機板和 Intel I219-V 晶片組出現 e1000e 錯誤

  • December 30, 2020

問題:

我最近購買了一些新硬體並且遇到了讓乙太網工作的問題,因為我嘗試過的核心和驅動程序的組合都沒有工作。我假設這個問題要麼是硬體故障,要麼是設備支持不佳(由於它最近發布的時間)。但鑑於我在下面嘗試過的,我想知道解決這個問題的下一步是什麼。

平台:

試錯:

我已經嘗試(不成功)使用以下核心和驅動程序版本的組合:

  • Debian 10.7 (Buster)、核心 4.19、核心 e1000e
  • Debian 10.7 (Buster),核心 4.19,編譯 e1000e 3.8.4
  • Debian 10.7 (Buster),核心 4.19,編譯 e1000e 3.8.7
  • Arch Linux LiveUSB,核心 5.9,核心 e1000e

lspci使用 2020-12-01 Arch Linux 安裝介質,我從、等處獲得以下診斷輸出dmesg

  • ip link
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN mode DEFAULT group default qlen 1000
   link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
  • uname -a
Linux archiso 5.9.11-arch2-1 #1 SMP PREEMPT Sat, 28 Nov 2020 02:07:22 +0000 x86_64 GNU/Linux
  • lspci -nn
00:00.0 Host bridge [0600]: Intel Corporation Device [8086:9b63] (rev 03)
00:01.0 PCI bridge [0604]: Intel Corporation Xeon E3-1200 v5/E3-1500 v5/6th Gen Core Processor PCIe Controller (x16) [8086:1901] (rev 03)
00:02.0 VGA compatible controller [0300]: Intel Corporation Device [8086:9bc8] (rev 03)
00:14.0 USB controller [0c03]: Intel Corporation Device [8086:a3af]
00:14.2 Signal processing controller [1180]: Intel Corporation Device [8086:a3b1]
00:16.0 Communication controller [0780]: Intel Corporation Device [8086:a3ba]
00:17.0 SATA controller [0106]: Intel Corporation Device [8086:a382]
00:1b.0 PCI bridge [0604]: Intel Corporation Device [8086:a3e9] (rev f0)
00:1b.4 PCI bridge [0604]: Intel Corporation Device [8086:a3eb] (rev f0)
00:1c.0 PCI bridge [0604]: Intel Corporation Device [8086:a394] (rev f0)
00:1d.0 PCI bridge [0604]: Intel Corporation Device [8086:a398] (rev f0)
00:1f.0 ISA bridge [0601]: Intel Corporation Device [8086:a3c8]
00:1f.2 Memory controller [0580]: Intel Corporation Device [8086:a3a1]
00:1f.3 Audio device [0403]: Intel Corporation Device [8086:a3f0]
00:1f.4 SMBus [0c05]: Intel Corporation Device [8086:a3a3]
00:1f.6 Ethernet controller [0200]: Intel Corporation Ethernet Connection (12) I219-V [8086:0d55]
01:00.0 Serial Attached SCSI controller [0107]: Broadcom / LSI SAS2008 PCI-Express Fusion-MPT SAS-2 [Falcon] [1000:0072] (rev 03)
02:00.0 PCI bridge [0604]: Integrated Technology Express, Inc. IT8892E PCIe to PCI Bridge [1283:8892] (rev 41)

核心 4.19似乎不支持我的乙太網晶片組(設備程式碼 0d55),這似乎只在 5.5 及更高版本中受支持。所以在我的 Debian Buster安裝中不受支持是有道理的,但是自編譯的 3.8.4/3.8.7 e1000e 驅動程序仍然損壞是沒有意義的,因為我的晶片組應該從 3.5 版開始就得到支持.1

  • dmesg | grep e1000e
[    7.373433] e1000e: Intel(R) PRO/1000 Network Driver
[    7.373434] e1000e: Copyright(c) 1999 - 2015 Intel Corporation.
[    7.373684] e1000e 0000:00:1f.6: Interrupt Throttling Rate (ints/sec) set to dynamic conservative mode
[    7.749973] e1000e 0000:00:1f.6 0000:00:1f.6 (uninitialized): Failed to disable ULP
[    8.340480] e1000e: probe of 0000:00:1f.6 failed with error -2

注意 PCI 地址0000:00:1f.6,它對應於lspci輸出中的集成 I219-V 晶片組。

ULP 錯誤出現在 Arch Linux liveUSB 中,但它沒有出現在我的 Debian Stable 測試中。但是,探測錯誤仍然存在。-2 對應的錯誤,-E1000_ERR_PHY有人報告有以下解決方案

  • 禁用 LAN 喚醒
  • 拔掉電源,等待幾個小時到一天再試一次
  • 在介面上線之前不要插入乙太網

我試過這些都無濟於事。IRC 上的朋友建議 ULP(超低功耗)錯誤可能表明卡一直卡在 ULP 模式,這就是為什麼嘗試探測設備失敗並出現 PHY 錯誤的原因。

有人建議這個郵件列表執行緒可能是相關的,但我不確定嘗試獲取他們的送出原始碼並自己應用所有相關更新檔是否會有所幫助。如果有人堅持會,我很樂意嘗試。

**更新 1:**一位朋友有一個聰明的想法,即嘗試全新的 Windows 安裝來幫助診斷它是否是硬體問題。安裝 Windows 10 並使用提供的主機板驅動程序包後,可以辨識該卡,但 Windows 設備管理器給出“設備無法啟動(程式碼 10)”錯誤。(我認為此時很明顯這不是 *nix 特有的問題,所以我應該關閉問題並直接聯繫 Gigabyte/Intel,或者請某人將這篇文章移至 Superuser 站點。)

事實證明,這很可能是硬體問題。我得到了一塊替換主機板,奇怪的是,網路硬體被 Debian 10.7 安裝程序辨識(似乎我對 Debian 核心中包含哪些版本的 e1000e 的理解是錯誤的……我應該調查一下。)

希望其他人可以使用我的反複試驗來避免我過去一周遇到的同樣的頭痛:)

引用自:https://unix.stackexchange.com/questions/625912