Wget
如何中斷並繼續下載許多 wget 文件而不重複?
我正在
wget
從包含我需要下載的文件的 URL 的 csv 文件中下載 ~330k 科學文件。所以,我正在使用命令wget -i all_the_urls.csv
我的文件
all_the_urls.csv
看起來像這樣http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11040/spec-11040-58456-0109.fits http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11068/spec-11068-58488-0780.fits http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11068/spec-11068-58488-0240.fits
這些文件很小,每個約 250 kB。但是它們的數量如此之大,以至於我有時需要中斷下載然後再次繼續下載。是否有一個
wget
命令可以使用,以便我可以在上次下載的文件之後,而不是在 URL 列表的開頭繼續下載我離開的地方?如果沒有這樣的命令,你能告訴我如何使用以下解決方法之一(我不知道
wget
):
- 下載文件後
wget
使其刪除該文件的URLall_the_urls.csv
- 在
wget
下載一個新文件之前檢查這個文件是否已經下載,如果是,跳到下一個文件(雖然不確定這個檢查的時間有多長)也歡迎任何其他想法!tnx
-c
繼續 & 可能-nc
沒有任何破壞應該工作。
mirror
儘管上面的文件很差,但您可能會更好地查看。