調試核心恐慌 - 看門狗在 cpu 9 上檢測到硬 LOCKUP？

May 2, 2018

在新安裝的 SLES 11.4 上，我們從 /var/crash 中看到了這個 dmesg：

&lt;7&gt;[   48.600847] storage: no IPv6 routers present
&lt;6&gt;[   63.725477] BIOS EDD facility v0.16 2004-Jun-25, 1 devices found
&lt;6&gt;[  310.226578] [Hardware Error]: Machine check events logged
&lt;6&gt;[ 3536.417543] lp: driver loaded but no devices found
&lt;6&gt;[ 3536.417582] ppdev: user-space parallel port driver
&lt;6&gt;[ 3536.983736] lp: driver loaded but no devices found
&lt;6&gt;[ 3537.005660] Uniform Multi-Platform E-IDE driver
&lt;6&gt;[ 3537.011756] ide-cd driver 5.00
&lt;6&gt;[ 3537.033960] st: Version 20101219, fixed bufsize 32768, s/g segs 256
&lt;0&gt;[ 3691.340041] Kernel panic - not syncing: Watchdog detected hard LOCKUP on cpu 9
&lt;4&gt;[ 3691.447069] Pid: 0, comm: kworker/0:1 Tainted: G             X 3.0.101-107-default #1
&lt;4&gt;[ 3691.554690] Call Trace:
&lt;4&gt;[ 3691.590254]  [&lt;ffffffff81004b35&gt;] dump_trace+0x75/0x300
&lt;4&gt;[ 3691.664599]  [&lt;ffffffff81467873&gt;] dump_stack+0x69/0x6f
&lt;4&gt;[ 3691.738878]  [&lt;ffffffff8146792f&gt;] panic+0xb6/0x224
&lt;4&gt;[ 3691.804367]  [&lt;ffffffff810c900c&gt;] watchdog_overflow_callback+0xdc/0xe0
&lt;4&gt;[ 3691.896736]  [&lt;ffffffff810f55fa&gt;] __perf_event_overflow+0xaa/0x230
&lt;4&gt;[ 3691.980294]  [&lt;ffffffff81018808&gt;] intel_pmu_handle_irq+0x1a8/0x370
&lt;4&gt;[ 3692.069469]  [&lt;ffffffff8146c8f1&gt;] perf_event_nmi_handler+0x31/0xa0
&lt;4&gt;[ 3692.156027]  [&lt;ffffffff8146ea47&gt;] notifier_call_chain+0x37/0x70
&lt;4&gt;[ 3692.239630]  [&lt;ffffffff8146ea8d&gt;] __atomic_notifier_call_chain+0xd/0x20
&lt;4&gt;[ 3692.334749]  [&lt;ffffffff8146eadd&gt;] notify_die+0x2d/0x40
&lt;4&gt;[ 3692.409254]  [&lt;ffffffff8146c073&gt;] default_do_nmi+0x33/0xc0
&lt;4&gt;[ 3692.489610]  [&lt;ffffffff8146c168&gt;] do_nmi+0x68/0x80
&lt;4&gt;[ 3692.558033]  [&lt;ffffffff8146b595&gt;] restart_nmi+0x1e/0x2e

重新安裝它以檢查它是硬體還是軟體問題，但是當我們執行 DSA 日誌時它仍然崩潰（開始時間約為 3500 秒正常執行時間）。

**問題：**從這個 dmesg（或任何其他資訊）中，我們可以確定導致崩潰的原因是什麼？cpu9錯誤？或驅動程序錯誤？

看起來升級 megaraid 韌體（還有一個 ram dimm 問題！）修復了 DSA 期間的崩潰。

引用自：https://unix.stackexchange.com/questions/440387

調試核心恐慌 - 看門狗在 cpu 9 上檢測到硬 LOCKUP？

相關問答

我在哪裡可以獲得 SUSE SLES 產品的目前原始碼？

如何為系統範圍的使用創建 curlrc 文件？

`/var/crash/` 中的文件是什麼？

每次安裝或更新 rpm 時更新 initramfs

如何禁用（然後重新啟用）我的一個 NVIDIA GPU？

resume= 在我的 grub 引導設置中用於什麼？

調試核心恐慌 - 看門狗在 cpu 9 上檢測到硬 LOCKUP？

相關問答

我在哪裡可以獲得 SUSE SLES 產品的目前原始碼？

如何為系統範圍的使用創建 curlrc 文件？

/var/crash/ 中的文件是什麼？

每次安裝或更新 rpm 時更新 initramfs

如何禁用（然後重新啟用）我的一個 NVIDIA GPU？

resume= 在我的 grub 引導設置中用於什麼？

`/var/crash/` 中的文件是什麼？