Wget
使用 wget 只下載一個 tumblr 頁面
我只想在 tumblr 上下載一頁的圖像。
例如http://landscapes.tumblr.com/page/7
在瀏覽器上傳入此頁面時(我嘗試過 firefox 和 chrome),正好有 15 張圖片,但是當我嘗試使用 wget 下載它們時,我得到 60 張圖片(對應於第 7-11 頁)。我用於下載的命令是
wget -H -k -p -R "*avatar*" -A '.jpeg,.jpg,.bmp,.gif,.png' -np -nd -N -erobots=off -i http://landscapes.tumblr.com/page/7
有人能解釋一下為什麼 wget 下載的頁面比作為參數給出的頁面多,以及如何讓它只下載一頁嗎?提前謝謝你。
從wget 手冊:
-i file
--input-file=file
從本地或外部文件中讀取 URL 。
$$ … $$
-p
--page-requisites
此選項使 Wget 下載正確顯示給定 HTML 頁面所需的所有文件。這包括內聯圖像、聲音和引用樣式表等內容。
由於您的命令包括這兩者,因此您正在檢索原始頁面、從該頁面連結的所有內容(包括所有後續頁面)以及每個頁面的所有必要條件。
刪除 後
-i
,它只獲取原始頁面的必要條件。