如果 wget 遵循廣度優先或深度優先

November 2, 2018

在執行 wget 時，我預計它會“跟隨連結”，就像深度優先：當它遇到一個連結時，它就是它獲取的下一個東西。但它似乎首先以某種方式處理第一頁，獲取所有連結，然後執行這些連結。對於它獲取的每個頁面，可能有新的/嵌套的連結，但在原始頁面完成之前它不會到達這些連結。想問一下這是否真的是它的工作原理，所以我知道我正在做的事情是否有效，它只是在完成起始頁面的連結之前不會獲取這些頁面。

從手冊：
使用 HTTP URL，Wget 從給定的 URL 檢索和解析 HTML 或 CSS，通過類似hrefor的標記或使用 ’ ’ 功能符號src指定的 CSS URI 值來檢索文件引用的文件。url()如果新下載的文件也是 , , 或類型 text/html，application/xhtml+xml它將text/css被解析並進一步跟踪。
HTTP 和 HTML/CSS 內容的遞歸檢索是廣度優先的。這意味著 Wget 首先下載請求的文件，然後是從該文件連結的文件，然後是它們連結的文件，依此類推。換句話說，Wget 首先下載深度為 1 的文件，然後是深度為 2 的文件，以此類推，直到指定的最大深度。

引用自：https://unix.stackexchange.com/questions/479280

相關問答

Linux wget -O /dev/null <http….> 語法

September 3, 2022

瀏覽器從本地“index.html”-file 重定向到“file:///”-root

July 1, 2022

是否可以搜尋 .tar.gz 文件廣度優先？

June 2, 2022

如何從 BLAST 數據庫目錄中獲取所有 Betacoronavirus .tar.gz 文件？

May 22, 2022

我將 wget 安裝到我的本地目錄中，因為系統範圍的 wget 已過時。如何使用更新的 wget 而不是系統範圍的？

May 21, 2022

如何正確下載此網頁？

May 17, 2022