Pdf
發現有關 PDF 的元數據
假設我有一個 PDF,我想獲取該 PDF 可用的任何元數據。我應該使用什麼實用程序?
我發現我通常最感興趣的資訊是紙張大小,這是 PDF 查看器通常不會報告的。例如,是 PDF 大小的字母、合法、A4 還是其他?但其他可用資訊也可能令人感興趣。
如果我記得的話,其中一個規範的工具是
pdfinfo
xpdf 附帶的。範例輸出:[0 1017 17:10:17] ~/temp % pdfinfo test.pdf Creator: TeX Producer: pdfTeX-1.40.14 CreationDate: Sun May 18 09:53:06 2014 ModDate: Sun May 18 09:53:06 2014 Tagged: no Form: none Pages: 1 Encrypted: no Page size: 595.276 x 841.89 pts (A4) Page rot: 0 File size: 19700 bytes Optimized: no PDF version: 1.5
另一個值得研究的實用程序是exiftool。在您的特定情況下,它可能不是正確的工具,因為它不會報告有關文件幾何形狀的任何資訊,但總的來說,它可能是檢查 PDF 元數據的功能最完整的工具。
這是一個命令範例,它將列印所有可用的元資訊 (
-a
),按組 (-G1
) 排序:exiftool -a -G1 "$File"
官方文件提供了支持的 PDF 相關標籤的概述:
您可以使用以下命令在 Debian/Ubuntu 上安裝 exiftool:
sudo apt-get install libimage-exiftool-perl
如果你更喜歡 GUI 方面的東西,你可以試試我的項目PDFMtEd。它是一組工具,用作 exiftool 的圖形前端,並允許查看和編輯 PDF 元數據。
這是幾個螢幕截圖: