Centos
Centos 7終端上的wget如何僅下載沒有網站樣式程式碼的文本
sudo wget -O /home/KrypticRelic/Desktop/DefaultAccess.txt phenoelit.org/dpl/dpl.html
這會為我想要的實際文本列印出大量的填充。
前任。
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"> <html><head><title>Default Password List</title></head> <body bgcolor="#000000" link=#FF6600 vlink=#CC6600 alink=#FFFF00 text=#FF9900 > <CENTER><H1>Default Password List</H1><h2>2007-07-03 </h2> <TABLE FRAME=VOID CELLSPACING=0 COLS=47 RULES=NONE BORDER=0> <COLGROUP><COL WIDTH=177><COL WIDTH=348><COL WIDTH=472><COL WIDTH=292><COL WIDTH=150><COL WIDTH=399><COL WIDTH=429><COL WIDTH=841><COL WIDTH=34><COL WIDTH=94><COL WIDTH=66><COL WIDTH=208><COL WIDTH=48><COL WIDTH=48><COL WIDTH=45><COL WIDTH=51><COL WIDTH=86><COL WIDTH=34><COL WIDTH=79><COL WIDTH=71><COL WIDTH=208><COL WIDTH=48><COL WIDTH=41><COL WIDTH=41><COL WIDTH=40><COL WIDTH=86><COL WIDTH=34><COL WIDTH=59><COL WIDTH=66><COL WIDTH=208><COL WIDTH=48><COL WIDTH=48><COL WIDTH=65><COL WIDTH=40><COL WIDTH=86><COL WIDTH=34><COL WIDTH=74><COL WIDTH=171><COL WIDTH=86><COL WIDTH=45><COL WIDTH=48><COL WIDTH=48><COL WIDTH=51><COL WIDTH=119><COL WIDTH=28><COL WIDTH=64><COL WIDTH=71></COLGROUP> <TBODY> <TR> <TD WIDTH=177 HEIGHT=17 ALIGN=LEFT>Vendor</TD> <TD WIDTH=348 ALIGN=LEFT>Model</TD> <TD WIDTH=472 ALIGN=LEFT>Version</TD> <TD WIDTH=292 ALIGN=LEFT>Access Type</TD> <TD WIDTH=150 ALIGN=LEFT>Username</TD> <TD WIDTH=399 ALIGN=LEFT>PASSWORD</TD> <TD WIDTH=429 ALIGN=LEFT>Privileges</TD> <TD WIDTH=841 ALIGN=LEFT>Notes</TD>
如何刪除 HTML 並保留列表?上面提供了該站點,因此您可以看到我在說什麼。
要在刪除 html 的情況下下載,請使用
links
(或lynx
)-dump
選項:links -dump http://website.web
或者:
lynx -dump http://website.web
兩者的輸出風格不同。一方面,
lynx
將格式化 hyperrefs 而links
忽略它們。安裝
在類似 debian/ubuntu 的系統上,任何一個程序都可以安裝
apt-get
:apt-get install links apt-get install lynx