Wget

如果 wget 遵循廣度優先或深度優先

  • November 2, 2018

在執行 wget 時,我預計它會“跟隨連結”,就像深度優先:當它遇到一個連結時,它就是它獲取的下一個東西。但它似乎首先以某種方式處理第一頁,獲取所有連結,然後執行這些連結。對於它獲取的每個頁面,可能有新的/嵌套的連結,但在原始頁面完成之前它不會到達這些連結。想問一下這是否真的是它的工作原理,所以我知道我正在做的事情是否有效,它只是在完成起始頁面的連結之前不會獲取這些頁面。

手冊

使用 HTTP URL,Wget 從給定的 URL 檢索和解析 HTML 或 CSS,通過類似hrefor的標記或使用 ’ ’ 功能符號src指定的 CSS URI 值來檢索文件引用的文件。url()如果新下載的文件也是 , , 或 類型 text/htmlapplication/xhtml+xml它將text/css被解析並進一步跟踪。

HTTP 和 HTML/CSS 內容的遞歸檢索是廣度優先的。這意味著 Wget 首先下載請求的文件,然後是從該文件連結的文件,然後是它們連結的文件,依此類推。換句話說,Wget 首先下載深度為 1 的文件,然後是深度為 2 的文件,以此類推,直到指定的最大深度。

引用自:https://unix.stackexchange.com/questions/479280