Csv

作為擴展 ascii 的 gawk 欄位分隔符

  • November 3, 2017

我在 RHEL 6.x 上使用gawk 3.1.7

我有大型 CSV 文件要使用欄位分隔符“邏輯否定符號 / ALT + 170”(查看 ASCII 表)進行解析,但我無法將其用作gawk.

我嘗試了很多事情,例如-F "\xaa"-F "\252"但沒有奏效。有沒有辦法在 gawk 的欄位分隔符中使用這個字元?

順便說一句,我用這個字元創建了文件(文件中只有一個字元),如果我按照它的工作方式使用它。

-F "$(cat singleExtendedAsciiCharFile)"

但是我認為這不安全(有人可以刪除此文件)。你對我的問題有什麼想法嗎?

首先找到字元的十六進制程式碼:

$ echo -n '¬' | od -An -tx1
c2 ac

然後\x在每組數字之前添加:

$ awk -F '\xc2\xac'

使用外殼創建角色:

awk -F $'\xaa'

引用自:https://unix.stackexchange.com/questions/402361