Terminal

如何將終端中的文本保存為各種文本格式?

  • March 9, 2021

我正在玩一些 OCR 軟體,特別是我在 tesseract 上花了一些時間。我把它放到了可以載入圖像並讓 tesseract 在 Linux 終端中從圖像中提取文本的位置。我現在正試圖弄清楚如何從終端自動將翻錄的文本保存為 pdf、odf、txt 和 word 格式。

查看man 1 tesseract,您似乎可以使用以下形式的命令將其輸出保存為一種或多種特定格式:

tesseract image_file output_file pdf txt

其中四個參數在一般命令概要中分別扮演FILE,OUTPUTBASE和(重複兩次) 的角色。CONFIGFILE此命令創建兩個文件,output_file.pdf並且output_file.txt.

引用自:https://unix.stackexchange.com/questions/638143