Debian
如何監控生產系統執行狀況、生成崩潰報告等
我有一個在相當不錯的硬體上執行的家庭伺服器(CPU 是具有 24/48 核的 Threadripper 2970WX)。它上面執行著許多不同的東西,一些帶有不同軟體的虛擬機,部分是辦公軟體,還有伺服器、機器人和許多其他工具。有時,電腦突然崩潰,這是不好的,因為這是一個生產系統,並且有很多人依賴它。它很少崩潰,而且大多數時候我在家並且可以立即重新啟動它。不過,我想知道是否有一個工具可以監控我的系統執行狀況並嘗試提前警告系統故障,或者生成崩潰報告,以便我知道究竟是什麼導致了問題以及如何解決它。有沒有工具可以處理這個問題,最好是 GUI?我不
我正在執行 Debian 10 Buster 作為我的主機系統以及我所有重要的虛擬機。
有一個名為 kdump 的實用程序。你可以在你的系統上配置它,當你的系統崩潰時,你的準時系統狀態會被擷取在 crash-dump 文件夾中。這是我使用過的並且可以建議的。如果您知道導致系統崩潰的原因,您可以編寫一個腳本來修復該問題並將其安排為 cron 作業。