Gedit

如何在 gedit 上掃描無效字元?

  • April 12, 2013

我在是否編輯 javascript 文件時陷入兩難境地。當我用 gedit 打開它時,它顯示以下警告:

您打開的文件有一些無效字元。如果您繼續編輯此文件,您可能會損壞此文件。您也可以選擇其他字元編碼並重試。

目前編碼是 UTF-8。由於該文件有超過 100,000 行程式碼,是否有快速掃描無效字元的方法?

由於文件是 UTF-8,您可以執行isutf8。一個額外的 utils 包。它為您提供壞字節的行、字元和偏移量。

然後用xxd、hexdump之類的來分析。

不幸的是,它在第​​一次崩潰時停止。但話又說回來,它取決於文件​​。可能只有一個壞字節;)

有一些 C 程式碼可以對整個文件進行類似的分析。它在一個早已被遺忘的磁碟上。有需要可以找找。

否則,是的,快速且不那麼骯髒的方法是在使用 gedit 保存的副本之間進行差異 - 正如好先生所建議的那樣。@馮布蘭德

引用自:https://unix.stackexchange.com/questions/72172