Emacs
替換 Emacs 中的控製字元?
這是一個小文本:
什麼\222s 與所有括號?
在 Emacs
\222
中,上面顯示為控製字元(紅色)。它應該是'
,但我不明白為什麼會這樣\222
,即使我知道文本可能是從 OCR 生成的?
\222
我可以通過搜尋控製字元C-s C-q 2 2 2
'
但是當我嘗試以類似方式替換它時,我不能:M-% C-q 2 2 2 '
所以我想知道如何進行替換?是不是不需要更換?謝謝。
\222
CP-1252中的字元編碼是’
,即Unicode中的U+2019右單引號。要指示 Emacs 該文件採用 CP-1252 編碼,請執行
C-x RET r
(revert-buffer-with-coding-system
) 並選擇cp1252
。然後將文件保存為 UTF-8(Linux 和其他 unix 系統上事實上的標準編碼),執行C-x RET f
(set-buffer-file-coding-system
) 並選擇utf-8
.您應該可以替換
\222
為'
,但這可能不匹配,因為 Emacs 在後台使用不同的編碼系統來處理緩衝區內容和搜尋,因為\222
Emacs 猜測的預設編碼中的無效字元(latin1 )。如果您聲明正確的編碼,此問題將得到解決(並將\222
顯示為’
)。如果您想替換字元而不告訴 Emacs 有關編碼的任何事情,請將字元從緩衝區複製粘貼到搜尋字元串。