Debian
如何執行pdftotext … |grep 在許多文件上?
適用於單個文件的程式碼
pdftotext *.pdf - | grep therapy
您可以
find
按照執行緒How can I grep in PDF files?但我想了解為什麼上述命令不起作用。差分程式碼
pdfgrep
可能會增加一些好處,但仍處於開發早期pdftotext *.pdf - | pdfgrep therapy #Wrong syntax so error # Usage: pdfgrep [OPTION]... PATTERN FILE... # Syntax Warning: Invalid Font Weight # Syntax Warning: Invalid Font Weight
如果匹配良好,我想獲得一種快速移動到特定 pdf 頁面的方法。但是,我還沒有發現任何證據表明存在這種功能。
作業系統:Debian 8.5
Linux 核心:4.6 backports
硬體:華碩 Zenbook UX303UA
Poppler-utils:pdftotext
直接使用
pdfgrep
即可:pdfgrep -n therapy *.pdf
該
-n
選項將顯示每個匹配項的頁碼。
你可以試試這個;
pdfgrep therapy *.pdf
或者
find /tmp -name '*.pdf' -exec pdfgrep test {} +
例如;
user@host $ pdfgrep test *.pdf 1.pdf:test1 1.pdf:test2 1.pdf:test3 2.pdf:test1 2.pdf:test2 2.pdf:test3 test (copy).pdf:test1 test (copy).pdf:test2 test (copy).pdf:test3 user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} + /tmp/test (copy).pdf:test1 /tmp/test (copy).pdf:test2 /tmp/test (copy).pdf:test3 /tmp/1.pdf:test1 /tmp/1.pdf:test2 /tmp/1.pdf:test3 /tmp/2.pdf:test1 /tmp/2.pdf:test2 /tmp/2.pdf:test3