Wget

使用 wget 只下載一個 tumblr 頁面

  • August 17, 2016

我只想在 tumblr 上下載一頁的圖像。

例如http://landscapes.tumblr.com/page/7

在瀏覽器上傳入此頁面時(我嘗試過 firefox 和 chrome),正好有 15 張圖片,但是當我嘗試使用 wget 下載它們時,我得到 60 張圖片(對應於第 7-11 頁)。我用於下載的命令是

wget -H -k -p -R "*avatar*" -A '.jpeg,.jpg,.bmp,.gif,.png' -np -nd -N -erobots=off -i http://landscapes.tumblr.com/page/7

有人能解釋一下為什麼 wget 下載的頁面比作為參數給出的頁面多,以及如何讓它只下載一頁嗎?提前謝謝你。

wget 手冊

-i file

--input-file=file

從本地或外部文件中讀取 URL 。

$$ … $$

-p

--page-requisites

此選項使 Wget 下載正確顯示給定 HTML 頁面所需的所有文件。這包括內聯圖像、聲音和引用樣式表等內容。

由於您的命令包括這兩者,因此您正在檢索原始頁面、從該頁面連結的所有內容(包括所有後續頁面)以及每個頁面的所有必要條件。

刪除 後-i,它只獲取原始頁面的必要條件。

引用自:https://unix.stackexchange.com/questions/303985