Csv
作為擴展 ascii 的 gawk 欄位分隔符
我在 RHEL 6.x 上使用gawk 3.1.7
我有大型 CSV 文件要使用欄位分隔符“邏輯否定符號 / ALT + 170”(查看 ASCII 表)進行解析,但我無法將其用作
gawk
.我嘗試了很多事情,例如
-F "\xaa"
,-F "\252"
但沒有奏效。有沒有辦法在 gawk 的欄位分隔符中使用這個字元?順便說一句,我用這個字元創建了文件(文件中只有一個字元),如果我按照它的工作方式使用它。
-F "$(cat singleExtendedAsciiCharFile)"
但是我認為這不安全(有人可以刪除此文件)。你對我的問題有什麼想法嗎?
首先找到字元的十六進制程式碼:
$ echo -n '¬' | od -An -tx1 c2 ac
然後
\x
在每組數字之前添加:$ awk -F '\xc2\xac'
使用外殼創建角色:
awk -F $'\xaa'