Linux

在一組pdf文件中查找單詞或一組單詞

  • October 31, 2020

假設我有一個Note_De_cours包含 8 個其他目錄的目錄,即

Semaine_1  Semaine_3  Semaine_5  Semaine_7
Semaine_2  Semaine_4  Semaine_6  Semaine_8

這些目錄中的每一個都包含一些 pdf 文件。是否有命令行可以同時在每個 pdf 中搜尋一個單詞或一組單詞。Ctrl + f打開pdf,按並蒐索單詞很煩人。我曾想過使用grep,但我真的不是專家。也許還有其他一些最優化的方法可以做到這一點。

我想留在Note_De_Cours併申請pdfgrep同時查看所有 pdf。我希望命令告訴我哪個文件包含我想要的單詞或單詞集。我怎樣才能做到這一點?

編輯

我可以循環執行此命令:find elem -iname '*.pdf' -exec pdfgrep "baysien optimal" {} +onelem嗎?就像是for elem in ...; do find elem -iname '*.pdf' -exec pdfgrep "baysien optimal" {} +

我已經完成了for i in 1 2 3 4 5 6 7 8; do find Semaine_$i -iname '*.pdf' -exec pdfgrep "taux" {} +; done,但它沒有輸出它來自的文件

代替

for i in 1 2 3 4 5 6 7 8; do  find Semaine_$i -iname '*.pdf' -exec pdfgrep "taux" {} +; done

如果要列印文件名,請在 find 上使用 -print (在匹配後列印名稱)或在 grep 上使用 -l (列印名稱而不是匹配項):

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep "taux" {} \; -print

或者

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep -l "taux" {} \;

此外,pdfgrep通過標誌具有內置遞歸功能-r,因此您可以簡單地執行以下操作:

pdfgrep -r -l "taux" Semaine_[1-8]

引用自:https://unix.stackexchange.com/questions/617071