Curl
wget 僅使用 {..} 的父頁面
我一直在嘗試下載網站中的特定頁面。該站點使用通用 URL 轉到如下頁面。
https://example.com/pages/?p=1
https://example.com/pages/?p=2
https://example.com/pages/?p=3最多 450。
我只想下載這些頁面,而不是頁面中連結的超連結(不是指子頁面,只是父文件,例如 ?p1 和 ?p2 等)。
我試過使用下面的命令,但它不起作用。
wget --load-cookies=cookies.txt https://example.com/pages/\?p\=\{1..450\}
這是否意味著 {..} 在 wget 中不起作用?如果沒有,wget 中是否有任何選項可以用來實現我的目標?
使用理解大括號擴展中算術範圍的外殼(例如
bash
andksh93
和zsh
):wget --load-cookies=cookies.txt "https://example.com/pages/?p="{1..450}
這將被擴展(在
wget
被呼叫之前)到wget --load-cookies=cookies.txt "https://example.com/pages/?p="1 "https://example.com/pages/?p="2 "https://example.com/pages/?p="3 ... "https://example.com/pages/?p="450
與
curl
:curl --cookie-jar cookies.txt "https://example.com/pages/?p="{1..450}
將輸出保存到單個文件中
curl
:curl --cookie-jar cookies.txt -Ooutfile{1..450}.html "https://example.com/pages/?p="{1..450}