Text-Processing

計算列中連續相同的欄位數

September 26, 2019

我的輸入文件如下所示：
bio, john
chem, john
lang, john
math, dina
math, john
math, matt
lang, matt
我想只計算一次名稱連續相同的行。對於這個輸入，我想得到：
john 2
dina 1
matt 1
有什麼方法可以使用 sed 或 awk 做到這一點？我完全迷失在這裡。

將前一個值儲存在變數中，如果值不同，則遞增關聯數組中的數字。
awk -F ', ' '{if ($2 != p) { c[$2]++ } p=$2}
            END { for (k in c) {print k, c[k]} }'

如果你想要一些快速的’n’dirty，你可以使用uniq去重複連續條目，然後排序+計數重複：
$ cut -d, -f2 file | uniq | sort | uniq -c
     1  dina
     2  john
     1  matt

引用自：https://unix.stackexchange.com/questions/543821

相關問答

Text-Processing

如何從文件中獲取兩個模式之間最後一次出現的行？

July 3, 2021

如何從電子郵件地址中提取域名並將其添加到管道分隔文件的新列中？

July 18, 2019

過濾並就地保存特定列中值小於或等於 ≤‎X 且帶有標題的行

September 15, 2017

Text-Processing

使用字典替換字元串

March 13, 2016

Text-Processing

僅刪除單引號中的逗號

October 26, 2022

bash 將行轉換為列

October 25, 2022