Pdf

將 PDF 的偶數頁和奇數頁提取為兩個單獨的 PDF

  • January 12, 2020

我有一個包含數百頁雙語文本的 PDF。由於我需要分別在每種語言上使用 OCR,我想抓取偶數頁和奇數頁並製作兩個單獨的 PDF,使用convertor ghostscript。我想先做的語言在奇數頁上。我可以使用什麼convertghostscript命令來獲取這些並將它們寫入新文件?

我會用pdftk來做。

pdftk A=all.pdf cat Aodd output odd.pdf
pdftk A=all.pdf cat Aeven output even.pdf

不幸的是, pdftk不再是開源的。(這是一個很長的故事。)

普通的gs引擎可以做到這一點:

 gs -sDEVICE=pdfwrite     \
    -sPageList=odd         \
    -sOutputFile=odd.pdf   \
    -dBATCH -dNOPAUSE      \
    file.pdf 

然後用“偶數”替換“奇數”以選擇偶數頁。

引用自:https://unix.stackexchange.com/questions/15649