如何在 gedit 上掃描無效字元？

April 12, 2013

我在是否編輯 javascript 文件時陷入兩難境地。當我用 gedit 打開它時，它顯示以下警告：
您打開的文件有一些無效字元。如果您繼續編輯此文件，您可能會損壞此文件。您也可以選擇其他字元編碼並重試。
目前編碼是 UTF-8。由於該文件有超過 100,000 行程式碼，是否有快速掃描無效字元的方法？

由於文件是 UTF-8，您可以執行isutf8。一個額外的 utils 包。它為您提供壞字節的行、字元和偏移量。
然後用xxd、hexdump之類的來分析。
不幸的是，它在第一次崩潰時停止。但話又說回來，它取決於文件。可能只有一個壞字節；）
有一些 C 程式碼可以對整個文件進行類似的分析。它在一個早已被遺忘的磁碟上。有需要可以找找。
否則，是的，快速且不那麼骯髒的方法是在使用 gedit 保存的副本之間進行差異 - 正如好先生所建議的那樣。@馮布蘭德。

引用自：https://unix.stackexchange.com/questions/72172

相關問答

如何遞歸替換文件中所有匹配的字元串？

September 10, 2022

如何在 gedit 中應用 darkTheme？

October 13, 2020

gedit安裝大小太大

June 5, 2019

無法調整 Gedit 視窗的大小

May 22, 2019

無法在超級使用者模式下打開 GUI 編輯器

March 9, 2019

cat 顯示文件內容，gedit 和 vim 顯示空白文件

February 27, 2019