Curl

以文本形式獲取 curl 頁面

  • February 23, 2021

是否有任何選項curl可以將頁面保存為文本

我的意思是,以同樣的方式,頁面可以在瀏覽器中保存為Text Files。至少,Firefox 有這個選項。

我需要它作為腳本,我只是做類似的事情

curl -s http://... 

但如果沒有所有 html 程式碼,它會讓事情更容易處理。

我找到了一個選項lynx,可以滿足我的要求:lynx -dump,但我寧願使用curl.

謝謝。

不,您可以lynx為此使用:

lynx -dump URL

更新。行動。對不起。我沒看到你知道猞猁。

我建議lynx用於此目的。它通常會產生非常可讀的輸出。有時您應該使用-width選項來增加輸出的寬度。

您可以考慮pandoc,這是一個將文件從一種標記格式轉換為另一種的強大工具。

curl -s URL | pandoc -f html -t plain

使用起來很簡單:

pandoc [OPTIONS] [FILES]
 -f FORMAT, -r FORMAT  --from=FORMAT, --read=FORMAT                    
 -t FORMAT, -w FORMAT  --to=FORMAT, --write=FORMAT                     
 -o FILE               --output=FILE                                   
                       --data-dir=DIRECTORY

鍵入pandoc --list-input-formatpandoc --list-output-formats了解可以移動的格式。

引用自:https://unix.stackexchange.com/questions/255537