Terminal
如何將終端中的文本保存為各種文本格式?
我正在玩一些 OCR 軟體,特別是我在 tesseract 上花了一些時間。我把它放到了可以載入圖像並讓 tesseract 在 Linux 終端中從圖像中提取文本的位置。我現在正試圖弄清楚如何從終端自動將翻錄的文本保存為 pdf、odf、txt 和 word 格式。
查看
man 1 tesseract
,您似乎可以使用以下形式的命令將其輸出保存為一種或多種特定格式:tesseract image_file output_file pdf txt
其中四個參數在一般命令概要中分別扮演
FILE
,OUTPUTBASE
和(重複兩次) 的角色。CONFIGFILE
此命令創建兩個文件,output_file.pdf
並且output_file.txt
.