Linux

如果伺服器失去了網際網路連接,哪些系統日誌可能會告訴我?

  • January 13, 2017

我有一個伺服器:

CentOS Linux release 7.3.1611 (Core)
3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

我認為它的網路連接切斷了一點(現在又回來了)。我無法在 /var/log/messages 中找到任何內容 - 也許我只是不知道要查找什麼?

基本上我在尋找兩件事:如果網卡有問題,如果伺服器失去了網際網路連接。

第二個顯然更難弄清楚(也許不可能?)。顯然我應該有一些外部監控解決方案,但從教育的角度來看,你會在哪裡(在主機本地)解決這個謎團?

檢查環形核心緩衝區 ( dmesg) - 您應該會看到網路連接事件的資訊。

如果 NIC 失去其連結,您的核心日誌(最近可查看的dmesg、較舊的journalctl -k或在 中配置的任何位置)可能會包含消息。/etc/rsyslog.conf當然,您可以通過拔下電纜輕鬆找到這些消息的外觀。例子:

Jan 13 11:16:33 Zia kernel: r8169 0000:07:01.0 lan: link down

Internet 連接失去更難,通常您會設置一些東西來檢測這一點(外部監控或從您的機器監控外部機器)。它也不是真正的二進制狀態——你可以有部分網際網路連接(可以連接到一些主機,但不是全部)。不過,您可以尋找線索:

  • 日誌/日誌中來自 NTP 的消息(例如,關於失去對等點),或檢查 NTP 對等點統計資訊(如果啟用)。
  • 日誌/日誌中有關網路連接失敗的消息(例如,如果您定期執行 fetchmail,它會抱怨它無法連接到您的 POP3 伺服器)
  • VPN 連接中斷(當 Internet 連接中斷時,我會收到大量 OpenVPN 日誌)。
  • Web(等)伺服器上的突然 0 負載。許多伺服器將收到的所有請求記錄到某些特定於伺服器的日誌中。
  • 同樣,如果您記錄系統負載(平均負載、執行隊列等),快速降至 0 是一個線索。
  • 防火牆日誌中沒有噪音(至少,如果您記錄被阻止的數據包)
  • 突然缺乏隨機蠕蟲攻擊(我從我正在執行的各種服務中收到大量失敗的身份驗證消息,並且幾個小時沒有收到任何消息將是一個很好的線索,沒有網際網路連接)
  • 流量級別,如果您正在監控(例如,使用 Cacti、MRTG、collectd 等)。如果你不是,你的 ISP 可能是——也許他們願意分享?
  • 如果您有其他機器與這台機器通信,請檢查這些機器的日誌。可能有失敗消息
  • 如果您向其他人提供服務,他們可能有日誌。
  • 如果您有支持台,他們可能知道(從他們接到的所有電話中)。

基本上,你在做偵探工作:你需要尋找線索。如果沒有監控,就不會有Interwebs is down日誌消息。

引用自:https://unix.stackexchange.com/questions/337172