Wget

如何中斷並繼續下載許多 wget 文件而不重複?

  • November 23, 2021

我正在wget從包含我需要下載的文件的 URL 的 csv 文件中下載 ~330k 科學文件。所以,我正在使用命令

wget -i all_the_urls.csv

我的文件all_the_urls.csv看起來像這樣

http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11040/spec-11040-58456-0109.fits
http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11068/spec-11068-58488-0780.fits
http://dr16.sdss.org/sas/dr16/sdss/spectro/redux/v5_13_0/spectra/lite/11068/spec-11068-58488-0240.fits

這些文件很小,每個約 250 kB。但是它們的數量如此之大,以至於我有時需要中斷下載然後再次繼續下載。是否有一個wget命令可以使用,以便我可以在上次下載的文件之後,而不是在 URL 列表的開頭繼續下載我離開的地方?

如果沒有這樣的命令,你能告訴我如何使用以下解決方法之一(我不知道wget):

  • 下載文件後wget使其刪除該文件的URLall_the_urls.csv
  • wget下載一個新文件之前檢查這個文件是否已經下載,如果是,跳到下一個文件(雖然不確定這個檢查的時間有多長)

也歡迎任何其他想法!tnx

-c繼續 & 可能-nc沒有任何破壞應該工作。

mirror儘管上面的文件很差,但您可能會更好地查看。

引用自:https://unix.stackexchange.com/questions/678788