Wget
我可以使用 wget 遞歸下載所有文件,但不能下載它們的實際內容嗎?
有時,我希望只獲取網站的目錄結構,但文件本身並不重要。我只想要他們的名字。有點像一面鏡子,其中每個條目都只是一個空的虛擬文件。
當然,執行一個
wget -r
然後執行一個腳本來清空所有文件可以正常工作,但是感覺很浪費,因為這對伺服器和我的頻寬都不好。一種更有效但更不優雅的方法是在每次遇到大文件時手動停止並重新啟動程序,或者設置一個非常短的超時時間。至少這大大減少了我必須下載的數據量。我的問題是:我可以讓 wget 只創建一個文件,而不下載它的內容嗎?還是我使用了錯誤的工具來完成這項工作?
按要求發布答案:
使用
--spider
選項:wget -r -nv --spider http://example.com
然後您可以從輸出中解析站點的結構。這不會下載沒有機會包含連結的文件,例如圖像。