Pdf

發現有關 PDF 的元數據

  • December 12, 2019

假設我有一個 PDF,我想獲取該 PDF 可用的任何元數據。我應該使用什麼實用程序?

我發現我通常最感興趣的資訊是紙張大小,這是 PDF 查看器通常不會報告的。例如,是 PDF 大小的字母、合法、A4 還是其他?但其他可用資訊也可能令人感興趣。

如果我記得的話,其中一個規範的工具是pdfinfoxpdf 附帶的。範例輸出:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

另一個值得研究的實用程序是exiftool。在您的特定情況下,它可能不是正確的工具,因為它不會報告有關文件幾何形狀的任何資訊,但總的來說,它可能是檢查 PDF 元數據的功能最完整的工具。

這是一個命令範例,它將列印所有可用的元資訊 ( -a),按組 ( -G1) 排序:

exiftool -a -G1 "$File"

官方文件提供了支持的 PDF 相關標籤的概述:

您可以使用以下命令在 Debian/Ubuntu 上安裝 exiftool:

sudo apt-get install libimage-exiftool-perl

如果你更喜歡 GUI 方面的東西,你可以試試我的項目PDFMtEd。它是一組工具,用作 exiftool 的圖形前端,並允許查看和編輯 PDF 元數據。

這是幾個螢幕截圖:

在此處輸入圖像描述

在此處輸入圖像描述

引用自:https://unix.stackexchange.com/questions/139809