sed：修改文本中每個單詞的每個非第一個單詞重複

November 25, 2018

我需要使用 sed 做類似的事情嗎？
qq    ab xyz     ab qq aa ab 
變成：
qq    ab xyz     +ab+ +qq+ aa +ab+

如果您的輸入不包含<,>也不包含+字元，您可以這樣做：
sed '
 s/[[:alnum:]]\{1,\}/&lt;&&gt;/g;:1
 s/$&lt;\([^&gt;]*$&gt;.*\)&lt;\2&gt;/\1+\2+/;t1
 s/[&lt;&gt;]//g'
如果可能的話，你總是可以逃避它們：
sed '
 s/:/::/g;s/&lt;/:{/g;s/&gt;/:}/g
 s/[[:alnum:]]\{1,\}/&lt;&&gt;/g;:1
 s/$&lt;\([^&gt;]*$&gt;.*\)&lt;\2&gt;/\1+\2+/;t1
 s/[&lt;&gt;]//g
 s/:}/&gt;/g;s/:{/&lt;/g;s/::/:/g'
那些假設你想在每一行上獨立地做到這一點。如果要對整個文件執行此操作，則需要先將整個文件載入到記憶體中（請注意，某些sed實現在那裡有大小限制）：
sed '
 :2
 $!{N;b2
 }
 s/:/::/g;s/&lt;/:{/g;s/&gt;/:}/g
 s/[[:alnum:]]\{1,\}/&lt;&&gt;/g;:1
 s/$&lt;\([^&gt;]*$&gt;.*\)&lt;\2&gt;/\1+\2+/;t1
 s/[&lt;&gt;]//g
 s/:}/&gt;/g;s/:{/&lt;/g;s/::/:/g'
不過，這將是非常低效的，並且會更容易perl：
perl -pe 's/\w+/$seen{$&}++ ? "+$&+" : $&/ge'
基於行：
perl -pe 'my %seen;s/\w+/$seen{$&}++ ? "+$&+" : $&/ge'

引用自：https://unix.stackexchange.com/questions/171265

sed：修改文本中每個單詞的每個非第一個單詞重複

相關問答

在命令行中刪除（可能是嵌套的）文本引號

使用 sed 去除字元串末尾的單詞模式

sed：抓取和替換最後一個反斜杠和逗號之間的所有數據

如何從文本文件中刪除視覺上的空行？

使用 ‘sed’ 替換任何單詞，而不是字元

bash 將行轉換為列