Text-Processing
從大型二進製文件中刪除輸入符
我有一個大的二進製文件(幾乎是二進製文件!),其中有很多
\ r\n*$$ gets Generated in windows env and doesn’t have controle over generating application $$. 我想從這個大文件中刪除\r*$$ =~ 1Gb $$在另一個舊版應用程序中做進一步
\r
處理 有沒有簡單的方法可以用unix方式做到這一點?
它要麼是二進制的,要麼不是。如果你的東西真的不是二進制的,而只是複雜的文本,這裡有幾個解決方案。
首先,許多 Linux 發行版都帶有一個名為的實用程序
dos2unix
,您可以在文件上執行該實用程序來轉換行尾樣式:$ dos2unix original_file converted_file
你也可以這樣
tr
做:$ tr -d '\r' < orignal_file > converted_file
或者使用 perl:
$ perl -pne 's/\r$//g' < orignal_file > converted_file