Pdf
如何將pdf轉換為電子書格式
有沒有辦法將 PDF 文件轉換為 epub、azw 或 mobi 等電子書格式?我正在尋找一個轉換速度很快的應用程序。我剛試過口徑。10 分鐘後,甚至沒有達到 2% 的轉化率。所以請不要口徑。CLI 是首選。
您應該嘗試
pdftotext
(在包中的 Ubuntu 下poppler-utils
)。它是一個命令行轉換器。它假定 PDF 包含文本並且不僅包含圖像。如果 PDF 文件包含圖像(沒有 OCR 資訊),您必須使用 OCR 解決方案,這要慢得多。
我已經成功地在被打亂的 PDF 文本上使用了 OCR 方法(通過以非線性方式將單個字元定位在頁面上)。然後,您使案例如
pdftoppm
獲取頁面的單個圖像和 OCR 那些。