Wget

如何從 URL 遞歸下載網頁及其連結內容?

  • December 9, 2020

我想用wget遞歸下載一個網頁。通過遞歸,我的意思是它可能指向的所有其他文件也應該被下載。這樣做的原因是我希望能夠合理地離線查看其內容。

我需要下載的網頁還連結到同一網站上的其他頁面,我希望我也可以下載它們。

可以這樣做wget嗎?有任何標誌嗎?

嘗試:

wget -r -np -k -p http://www.site.com/dir/page.html

args(參見man wget)是:

  • r遞歸到連結,也檢索這些頁面(預設最大深度為 5,可以使用 設置-l)。
  • np永遠不要進入父目錄(即,不要跟隨“home”連結並鏡像整個站點;這將阻止ccc在您的範例中進行上述操作)。
  • k轉換相對於本地副本的連結。
  • p獲取樣式表之類的頁面必備項(這是規則的一個例外np)。

如果我沒記錯的話,wget 將創建一個以域命名的目錄並將所有內容放在那裡,但以防萬一從空的 PWD 中嘗試。

引用自:https://unix.stackexchange.com/questions/84015