wget 僅使用 {..} 的父頁面

April 16, 2018

我一直在嘗試下載網站中的特定頁面。該站點使用通用 URL 轉到如下頁面。
https://example.com/pages/?p=1
https://example.com/pages/?p=2
https://example.com/pages/?p=3最多 450。
我只想下載這些頁面，而不是頁面中連結的超連結（不是指子頁面，只是父文件，例如 ?p1 和 ?p2 等）。
我試過使用下面的命令，但它不起作用。
wget --load-cookies=cookies.txt https://example.com/pages/\?p\=\{1..450\}
這是否意味著 {..} 在 wget 中不起作用？如果沒有，wget 中是否有任何選項可以用來實現我的目標？

使用理解大括號擴展中算術範圍的外殼（例如bashandksh93和zsh）：
wget --load-cookies=cookies.txt "https://example.com/pages/?p="{1..450}
這將被擴展（在wget被呼叫之前）到
wget --load-cookies=cookies.txt "https://example.com/pages/?p="1 "https://example.com/pages/?p="2 "https://example.com/pages/?p="3 ... "https://example.com/pages/?p="450
與curl：
curl --cookie-jar cookies.txt "https://example.com/pages/?p="{1..450}
將輸出保存到單個文件中curl：
curl --cookie-jar cookies.txt -Ooutfile{1..450}.html "https://example.com/pages/?p="{1..450}

引用自：https://unix.stackexchange.com/questions/438056

wget 僅使用 {..} 的父頁面

相關問答

從網站遞歸下載

如何正確下載此網頁？

curl和wget有什麼區別？

如何從 URL 遞歸下載網頁及其連結內容？

遞歸下載帶框架的網站

下載時限制wget或curl的下載速度