Linux
如果伺服器失去了網際網路連接,哪些系統日誌可能會告訴我?
我有一個伺服器:
CentOS Linux release 7.3.1611 (Core) 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
我認為它的網路連接切斷了一點(現在又回來了)。我無法在 /var/log/messages 中找到任何內容 - 也許我只是不知道要查找什麼?
基本上我在尋找兩件事:如果網卡有問題,如果伺服器失去了網際網路連接。
第二個顯然更難弄清楚(也許不可能?)。顯然我應該有一些外部監控解決方案,但從教育的角度來看,你會在哪裡(在主機本地)解決這個謎團?
檢查環形核心緩衝區 (
dmesg
) - 您應該會看到網路連接事件的資訊。
如果 NIC 失去其連結,您的核心日誌(最近可查看的
dmesg
、較舊的journalctl -k
或在 中配置的任何位置)可能會包含消息。/etc/rsyslog.conf
當然,您可以通過拔下電纜輕鬆找到這些消息的外觀。例子:Jan 13 11:16:33 Zia kernel: r8169 0000:07:01.0 lan: link down
Internet 連接失去更難,通常您會設置一些東西來檢測這一點(外部監控或從您的機器監控外部機器)。它也不是真正的二進制狀態——你可以有部分網際網路連接(可以連接到一些主機,但不是全部)。不過,您可以尋找線索:
- 日誌/日誌中來自 NTP 的消息(例如,關於失去對等點),或檢查 NTP 對等點統計資訊(如果啟用)。
- 日誌/日誌中有關網路連接失敗的消息(例如,如果您定期執行 fetchmail,它會抱怨它無法連接到您的 POP3 伺服器)
- VPN 連接中斷(當 Internet 連接中斷時,我會收到大量 OpenVPN 日誌)。
- Web(等)伺服器上的突然 0 負載。許多伺服器將收到的所有請求記錄到某些特定於伺服器的日誌中。
- 同樣,如果您記錄系統負載(平均負載、執行隊列等),快速降至 0 是一個線索。
- 防火牆日誌中沒有噪音(至少,如果您記錄被阻止的數據包)
- 突然缺乏隨機蠕蟲攻擊(我從我正在執行的各種服務中收到大量失敗的身份驗證消息,並且幾個小時沒有收到任何消息將是一個很好的線索,沒有網際網路連接)
- 流量級別,如果您正在監控(例如,使用 Cacti、MRTG、collectd 等)。如果你不是,你的 ISP 可能是——也許他們願意分享?
- 如果您有其他機器與這台機器通信,請檢查這些機器的日誌。可能有失敗消息
- 如果您向其他人提供服務,他們可能有日誌。
- 如果您有支持台,他們可能知道(從他們接到的所有電話中)。
基本上,你在做偵探工作:你需要尋找線索。如果沒有監控,就不會有Interwebs is down日誌消息。