Character-Encoding
如何檢測文本的字元編碼
我有一個 mySQL 數據庫,其中包含 HTML 頁面錯誤顯示的重音字元。
問題是我不信任數據庫為表報告的編碼,因為整個事情是從另一台發生故障的伺服器遷移而來的。
我試圖將字元轉換為幾種編碼,但我的問題是辨識源字元編碼。
我從數據庫中複製了一段文本。
這是應該顯示的片語
Photon 是一個多層、多層次的工具,用於創建 CAEmitterLayer 類型的發射器和粒子…
這就是它的顯示方式
FÃŗton 是一個多層、多層次的工具,用於創建 CAEmitterLayer 類型的發射器和粒子…
如我所見,這正在發生:
- ó 顯示為 Ãŗ
- ú 顯示為 Ãē
- â 顯示為 Ãĸ
- is 顯示為 Ê
- á 顯示為 ÃĄ
是否可以通過查看文本來辨識編碼?
對於簡單的文本,您可以使用以下工具:
enca
,file
.他們猜測並可以驗證文本的編碼。