Character-Encoding

如何檢測文本的字元編碼

May 2, 2017

我有一個 mySQL 數據庫，其中包含 HTML 頁面錯誤顯示的重音字元。
問題是我不信任數據庫為表報告的編碼，因為整個事情是從另一台發生故障的伺服器遷移而來的。
我試圖將字元轉換為幾種編碼，但我的問題是辨識源字元編碼。
我從數據庫中複製了一段文本。
這是應該顯示的片語
Photon 是一個多層、多層次的工具，用於創建 CAEmitterLayer 類型的發射器和粒子…
這就是它的顯示方式
FÃŗton 是一個多層、多層次的工具，用於創建 CAEmitterLayer 類型的發射器和粒子…
如我所見，這正在發生：
ó 顯示為 Ãŗ
ú 顯示為 Ãē
â 顯示為 Ãĸ
is 顯示為 ÃŠ
á 顯示為 ÃĄ
是否可以通過查看文本來辨識編碼？

對於簡單的文本，您可以使用以下工具：
enca,
file.
他們猜測並可以驗證文本的編碼。
對於 MySQL，您可以只使用簡單的 SQL 請求，就像這裡介紹的那樣：[ 1 ]、[ 2 ]。

引用自：https://unix.stackexchange.com/questions/362698

相關問答

head 和 grep 顯示的文本與 gedit 不同

August 2, 2022

Text-Processing

用 utf-8 功能替換 tr

May 15, 2022

字元在終端（st）中無法正確顯示

May 13, 2022

在所有終端中禁用 utf-8？

April 29, 2022

Text-Processing

修復字元編碼混亂

April 2, 2022

Ubuntu 和 Debian 對文件名有不同的字元編碼

March 31, 2022