刪除所有包含重複字母的行

March 21, 2017

我試圖找到關於這個主題的現有主題，但我找到了一些東西，但這不是我正在尋找的 100%，而且我最近幾天的網際網路連接很糟糕，所以我需要退出搜尋並發布一個新主題。 .
所以我的問題是我有一個包含多行（超過 50000 行）的 .txt 文件，每行有 5 個字母字元串，如下所示：
KKIUB
SDCVG
KJUTT
NGTHH
WWLEE
XGHTP
NJFRT
PPSFF
ZZZLP
XDRFX
JJJJJ
KIEYW
...
我希望刪除文件中包含兩個（或更多）相同字母的所有行。重複的順序並不重要，因此必須刪除在一行中包含兩次字母的所有行。請注意，有時可能有 5 個相同的字母，有時 3 個相同的字母，有時只有 2 個相同的字母 + 彼此不接近，例如“GOHIG”。
KKIUB ---&gt; delete
SDCVG ---&gt; stays
KJUTT ---&gt; delete
NGTHH ---&gt; delete
WWLEE ---&gt; delete
XGHTP ---&gt; stays
NJFRT ---&gt; stays
PPSFF ---&gt; delete
ZZZLP ---&gt; delete
XDRFX ---&gt; delete
JJJJJ ---&gt; delete
KIEYW ---&gt; stays
我正在嘗試使用sed功能，但無法獲得良好的結果。我也想將它導出到另一個 .txt 文件中。有什麼幫助嗎？

sed -e '/\(.\).*\1/d' yourfile &gt; youroutputfile

引用自：https://unix.stackexchange.com/questions/352927

刪除所有包含重複字母的行

相關問答

使用不同時間戳的 AWK 過濾重複項

使用 sed 替換文本並在特定模式後添加文本

如何列印文件中每個字元的（數字）ASCII 值？

如何使用 sed 管道將偶數行和奇數行中的小寫字母更改為“-”？

如何使用 sed 替換字元串？

在許多 URL 系列的長列表中刪除具有相同域的系列中的所有 URL，但最後一次出現除外