Sort

獲取所有單詞的文本文件單詞出現計數 & 列印輸出排序

  • June 10, 2019

我有一個命令可以處理文本文件,計算所有出現的單詞並像這樣列印出來:

user@box $˜ magic-command-i-forgot | with grep | and awk | sort ./textfile.txt
66: the
54: and
32: I
16: unix
12: bash
5:  internet
3:  sh
1: GNU/Linux

所以它不是逐行搜尋,而是逐字搜尋,它對所有單詞進行搜尋,而不僅僅是對 1 個單詞。我很久以前在網際網路上的某個地方找到了它,但我找不到或不記得它..

我會使用tr而不是awk

echo "Lorem ipsum dolor sit sit amet et cetera." | tr '[:space:]' '[\n*]' | grep -v "^\s*$" | sort | uniq -c | sort -bnr
  • tr只是用換行符替換空格
  • grep -v "^\s*$"修剪空行
  • sort準備作為輸入uniq
  • uniq -c計算出現次數
  • sort -bnr以數字倒序排序,同時忽略空格

哇。事實證明這是一個很好的命令來計算每行發誓

找 。-name “*.py” -exec cat {} ; | tr'

$$ :space: $$’ ‘$$ \n* $$’ | grep -v “^\s*$” | 排序 | 唯一的-c | 排序-bnr | grep 他媽的

引用自:https://unix.stackexchange.com/questions/39039