Wget
如何從 URL 遞歸下載網頁及其連結內容?
我想用
wget
遞歸下載一個網頁。通過遞歸,我的意思是它可能指向的所有其他文件也應該被下載。這樣做的原因是我希望能夠合理地離線查看其內容。我需要下載的網頁還連結到同一網站上的其他頁面,我希望我也可以下載它們。
可以這樣做
wget
嗎?有任何標誌嗎?
嘗試:
wget -r -np -k -p http://www.site.com/dir/page.html
args(參見
man wget
)是:
r
遞歸到連結,也檢索這些頁面(預設最大深度為 5,可以使用 設置-l
)。np
永遠不要進入父目錄(即,不要跟隨“home”連結並鏡像整個站點;這將阻止ccc
在您的範例中進行上述操作)。k
轉換相對於本地副本的連結。p
獲取樣式表之類的頁面必備項(這是規則的一個例外np
)。如果我沒記錯的話,wget 將創建一個以域命名的目錄並將所有內容放在那裡,但以防萬一從空的 PWD 中嘗試。