Debian

如何向 pdf 文件添加更多元數據,以便我了解更多資訊

  • July 30, 2021

很多時候,如果我遇到一些有趣的內容、辯論等,其中涉及一些 pdf,我很幸運,通常我會讓作者將內容/pdf 郵寄給我,或者在 IM 上給我發送相同的內容或其他. 隨著時間的推移,我忘記了上下文或誰將內容髮送給我。雖然我不知道限制,但我很確定至少可以添加幾個欄位。例如,這裡是我正在查看的 pdf 文件的元數據。

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

現在我問一種方法,我可以添加諸如超連結之類的欄位(這樣我就可以記住我從哪裡下載了特定文件),或者from : xyz@abc.com我總是可以知道/參考或在以後找出誰共享了內容/pdf文件與我一起。我確實看到了 pdftk 的手冊頁,或者更確切地說是 Debian 中的 pdftk-java。有一個東西叫update_info,但共享的例子並沒有讓我很容易理解一個人應該如何使用它。有人可以幫忙嗎?

首先,您必須導出相關文件的元數據。命令

pdftk file.pdf dump_data output metadata

將生成metadata一個包含所有元數據的文件file.pdf。在此文件中,您將找到以下形式的結構:

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

您可以通過添加行來​​創建自己的元數據密鑰

InfoBegin
InfoKey: Hyperlink
InfoValue: xyz@abc.com

到文件。最後,您需要更新file.pdfwith的元數據

pdftk file.pdf update_info metadata output file2.pdf

請注意,後者會生成一個新文件file2.pdf。現在,您有兩個文件:file1.pdf沒有添加的元數據和file2.pdf您的自定義元數據鍵。exiftool您可以使用返回的命令檢查一切是否順利

...
Hyperlink                       : xyz@abc.com
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

引用自:https://unix.stackexchange.com/questions/554159