Debian

如何執行pdftotext … |grep 在許多文件上?

  • October 20, 2016

適用於單個文件的程式碼

pdftotext *.pdf - | grep therapy

您可以find按照執行緒How can I grep in PDF files?但我想了解為什麼上述命令不起作用。

差分程式碼pdfgrep可能會增加一些好處,但仍處於開發早期

pdftotext *.pdf - | pdfgrep therapy
#Wrong syntax so error
# Usage: pdfgrep [OPTION]... PATTERN FILE...
# Syntax Warning: Invalid Font Weight
# Syntax Warning: Invalid Font Weight

如果匹配良好,我想獲得一種快速移動到特定 pdf 頁面的方法。但是,我還沒有發現任何證據表明存在這種功能。

作業系統:Debian 8.5

Linux 核心:4.6 backports

硬體:華碩 Zenbook UX303UA

Poppler-utils:pdftotext

直接使用pdfgrep即可:

pdfgrep -n therapy *.pdf

-n選項將顯示每個匹配項的頁碼。

你可以試試這個;

pdfgrep therapy *.pdf

或者

find /tmp -name '*.pdf' -exec pdfgrep test {} +

例如;

user@host $ pdfgrep test *.pdf 
1.pdf:test1
1.pdf:test2
1.pdf:test3
2.pdf:test1
2.pdf:test2
2.pdf:test3
test (copy).pdf:test1
test (copy).pdf:test2
test (copy).pdf:test3


user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} +
/tmp/test (copy).pdf:test1
/tmp/test (copy).pdf:test2
/tmp/test (copy).pdf:test3
/tmp/1.pdf:test1
/tmp/1.pdf:test2
/tmp/1.pdf:test3
/tmp/2.pdf:test1
/tmp/2.pdf:test2
/tmp/2.pdf:test3

引用自:https://unix.stackexchange.com/questions/317634