Sort
獲取所有單詞的文本文件單詞出現計數 & 列印輸出排序
我有一個命令可以處理文本文件,計算所有出現的單詞並像這樣列印出來:
user@box $˜ magic-command-i-forgot | with grep | and awk | sort ./textfile.txt 66: the 54: and 32: I 16: unix 12: bash 5: internet 3: sh 1: GNU/Linux
所以它不是逐行搜尋,而是逐字搜尋,它對所有單詞進行搜尋,而不僅僅是對 1 個單詞。我很久以前在網際網路上的某個地方找到了它,但我找不到或不記得它..
我會使用
tr
而不是awk:echo "Lorem ipsum dolor sit sit amet et cetera." | tr '[:space:]' '[\n*]' | grep -v "^\s*$" | sort | uniq -c | sort -bnr
tr
只是用換行符替換空格grep -v "^\s*$"
修剪空行sort
準備作為輸入uniq
uniq -c
計算出現次數sort -bnr
以數字倒序排序,同時忽略空格哇。事實證明這是一個很好的命令來計算每行發誓
找 。-name “*.py” -exec cat {} ; | tr'
$$ :space: $$’ ‘$$ \n* $$’ | grep -v “^\s*$” | 排序 | 唯一的-c | 排序-bnr | grep 他媽的