我的 /var/log/ 在幾分鐘內就神秘地填滿了 GB!在我重新安裝 Debian 7 之前有什麼治療方法嗎?
早上好,*nix 愛好者們!
我已經使用 Debian 7 一段時間了,最近一次升級後,我注意到我的根分區上的空間一直在用完。我的意思是我在磁碟上留下了“0”字節!因此,經過大量搜尋,我能夠在 /var/log 文件夾中歸零。我曾經
ls -s -S
在這個文件夾中按大小排列文件,注意到三個文件大小為 GB(例如 13-15 GB):
- 系統日誌
- 消息
- 核心日誌
是的,
logrotate
工作正常。它正在旋轉原木。例如,我在 /var/log 中看到了 kern.log.1 等。問題是日誌填充得非常快,以至於 logrotate 無能為力。顯然,作業系統中的某些日誌記錄程序正在寫入大量數據,這可能是由於不斷的錯誤或其他原因(??)。我不知道。我所知道的只是我的筆記型電腦過熱,因為由於這種持續的寫入過程,一直*在進行如此多的處理。*所以,我正在失去 CPU 能力和磁碟空間。
我的問題是:如何確定是哪個程序/守護程序造成了這個問題?如何找到問題的根本原因,以便我可以糾正它?閱讀這些巨大的日誌文件不是一種選擇。請。如果我嘗試在已經很忙的筆記型電腦上的葉子板或記事本等文本編輯器中提取 15 GB 的日誌文件,那麼打開. 那是不切實際的。
我意識到這個問題很廣泛,因為可能有任何程序/守護程序導致此問題,但我想知道是否有人以前經歷過這種情況,以及是否有任何我可以查看的常見嫌疑人。
更新:
按照 Eric 的建議,我將 /var/log 中的文件按修改時間排列,“syslog”是最後一個。所以,我
tail
編輯了它。結果:Apr 10 00:53:37 MyMachine kernel: [11608.690733] [<ffffffffa08e4005>] ? ath9k_reg_rmw+0x35/0x70 [ath9k_htc] Apr 10 00:53:37 MyMachine kernel: [11608.690742] [<ffffffff81084f57>] ? process_one_work+0x147/0x3b0 Apr 10 00:53:37 MyMachine kernel: [11608.690750] [<ffffffff81085764>] ? worker_thread+0x114/0x480 Apr 10 00:53:37 MyMachine kernel: [11608.690756] [<ffffffff81556065>] ? __schedule+0x2e5/0x790 Apr 10 00:53:37 MyMachine kernel: [11608.690765] [<ffffffff81085650>] ? create_worker+0x1c0/0x1c0 Apr 10 00:53:37 MyMachine kernel: [11608.690772] [<ffffffff8108ae91>] ? kthread+0xc1/0xe0 Apr 10 00:53:37 MyMachine kernel: [11608.690780] [<ffffffff8108add0>] ? kthread_create_on_node+0x1c0/0x1c0 Apr 10 00:53:37 MyMachine kernel: [11608.690788] [<ffffffff8155a23c>] ? ret_from_fork+0x7c/0xb0 Apr 10 00:53:37 MyMachine kernel: [11608.690795] [<ffffffff8108add0>] ? kthread_create_on_node+0x1c0/0x1c0 Apr 10 00:53:37 MyMachine kernel: [11608.690800] ---[ end trace 12dc8d8439345c1d ]
不幸的是,它並沒有給我太多提示。
syslog
您發布的片段中實際上有一個強烈的提示。行尾Apr 10 00:53:37 MyMachine kernel: [11608.690733] [<ffffffffa08e4005>] ? ath9k_reg_rmw+0x35/0x70 [ath9k_htc]
顯示堆棧跟踪是由於名為
ath9k_htc
. 希望核心沒有驚慌失措,但不斷重複的錯誤正在填滿您的文件系統。然後,我將
ath9k_htc
使用此命令將 wifi 驅動程序列入黑名單,然後重新啟動:echo "blacklist ath9k_htc" | sudo tee -a /etc/modprobe.d/blacklist.conf
ath9k_htc
請注意,如果儘管出現錯誤,驅動程序仍被使用且功能正常,這樣做可能會阻止您的 wifi 工作。您可以通過執行檢查驅動程序預期的 wifi 設備
ath9k_htc
是否存在於您的機器中,lsusb
並查看設備是否與此處可用的列表之一匹配:https ://wiki.debian.org/ath9k_htc