Character-Encoding

如何檢測文本的字元編碼

  • May 2, 2017

我有一個 mySQL 數據庫,其中包含 HTML 頁面錯誤顯示的重音字元。

問題是我不信任數據庫為表報告的編碼,因為整個事情是從另一台發生故障的伺服器遷移而來的。

我試圖將字元轉換為幾種編碼,但我的問題是辨識源字元編碼。

我從數據庫中複製了一段文本。

這是應該顯示的片語

Photon 是一個多層、多層次的工具,用於創建 CAEmitterLayer 類型的發射器和粒子…

這就是它的顯示方式

FÃŗton 是一個多層、多層次的工具,用於創建 CAEmitterLayer 類型的發射器和粒子…

如我所見,這正在發生:

  • ó 顯示為 Ãŗ
  • ú 顯示為 Ãē
  • â 顯示為 Ãĸ
  • is 顯示為 Ê
  • á 顯示為 ÃĄ

是否可以通過查看文本來辨識編碼?

對於簡單的文本,您可以使用以下工具:

  • enca,
  • file.

他們猜測並可以驗證文本的編碼。

對於 MySQL,您可以只使用簡單的 SQL 請求,就像這裡介紹的那樣:[ 1 ]、[ 2 ]。

引用自:https://unix.stackexchange.com/questions/362698