Operativsystemen är baserade på kommandorader som erbjuder oss flera alternativ för att öka distributionskapaciteten genom att kunna utföra sökningar, administrationsåtgärder, support och mycket mer.
Just ett av dessa alternativ är kopplat till möjligheten att söka efter vissa typer av filer i Linux och därmed enkelt komma åt deras innehåll och det är därför vi idag kommer att prata om pdfgrep som är inriktat på att söka efter PDF -filer.
Vad är pdfgrepPdfgrep är ett kommandoradsverktyg för att söka efter text i PDF -filer på ett enkelt och funktionellt sätt, vilket sparar oss tid från att komma åt varje fil och söka efter texten med PDF -verktyg.
Några av dess egenskaper är:
- Kompatibel med Grep kan vi köra många grep -parametrar som -r, -i, -n eller -c.
- Möjlighet att söka efter text i flera PDF -filer
- Utvalda färger, detta GNU Grep -färgalternativ stöds och aktiveras som standard.
- Stöder användning av reguljära uttryck.
- Gratis mjukvara
1. Installera Pdfgrep på Linux
Steg 1
I det här fallet kommer vi att använda Ubuntu för vilket det är tillräckligt för att köra följande rad. Där anger vi bokstaven S för att acceptera nedladdning och installation av paketen.
sudo apt installera pdfgrep
Steg 2
Andra installationsalternativ är:
- Ladda ner .TAR.GZ -filen på följande länk.
Steg 3
- Eller kör följande kommando:
git -klon https://gitlab.com/pdfgrep/pdfgrep.gitSteg 4
Ange sedan var och en av följande rader i sin ordning:
./configure make sudo make install
2. Använd Pdfgrep på Linux
Steg 1
När pdfgrep är installerat är detta syntaxen att använda:
pdfgrep [ALTERNATIV …] MÖNSTER [FIL]Steg 2
Var och en av elementen är:
- Alternativ: Anger attribut som vi kan lägga till i sökningen, till exempel -i eller --ignorera fall, som ignorerar skillnaden mellan stora och små bokstäver mellan det mönster som vi har angett och det som måste matcha filen.
- Mönster: Indikerar ett utökat reguljärt uttryck.
- Fil: Det är PDF -filen där sökningen måste utföras.
Steg 3
Vi börjar med en enkel sökning, till exempel letar vi efter ordet Solvetic i Solvetic.pdf -filen, för detta utför vi följande:
pdfgrep Solvetic Solvetic.pdf
FÖRSTORA
Steg 4
I det här fallet existerar denna term bara en gång i filen, men nu kommer vi att leta efter termen Windows i en officiell Microsoft PDF -fil och detta kommer att bli resultatet som vi kommer att se:
FÖRSTORA
Steg 5
Vi kan se att det sökte ordet markeras vilket underlättar dess placering. Om vi nu lägger till parametern -i, Det kommer att vara möjligt att se resultaten med sidnumret där denna term har upptäckts:
FÖRSTORA
Steg 6
Ett annat alternativ som vi kan använda med pdfgrep är att lista de PDF -filer som innehåller en viss term, för detta kör vi följande:
pdfgrep Solvetic * pdfSteg 7
På detta sätt kommer PDF -filen som innehåller termen Solvetic att listas:
FÖRSTORA
Steg 8
Om vi vill öppna PDF -filen kan vi utföra följande kommando:
xdg-open (File.PDF)
FÖRSTORA
Steg 9
De allmänna alternativen som pdfgrep erbjuder oss är:
-i, --ignore-caseIgnorera skillnader mellan olika fall i både käll- och inmatningsfiler.
-F, --fixed-stringsTolkar PATTERN som en lista över fasta strängar åtskilda av nya rader.
--cacheAnvänd en cache för återställd text för att påskynda driften av stora filer.
-P, --perl-regexpTolkar PATTERN som ett Perl-kompatibelt reguljärt uttryck (PCRE).
-H, --med filnamnSkriv ut filnamnet för varje matchning.
-h,-inget filnamnUndertrycker filnamnsprefixet i utdata.
-n,-sidnummerPrefix varje matchning med numret på sidan där söktermen hittades.
-c, --räkningUndertrycker normal utmatning och skriver ut antalet matchningar för varje inmatningsfil istället.
-p, -sidantalSkriv ut antalet matchningar per sida. Det innebär -n.
--FärgDet gör det möjligt att markera filnamn, sidnummer och matchande text med olika sekvenser för att visa dem i färg i terminalen, några av dess alternativ är alltid, nack eller automatisk.
-o,-bara matchandeSkriv ut endast den matchande delen av en rad utan något omgivande sammanhang.
-r, --rekursivDet tillåter oss att rekursivt söka efter alla filer (begränsade av --inkludera och --kludera) under varje katalog, endast efter de symboliska länkarna om de finns på kommandoraden.
-R,-rekursiv-referensSamma som -r, men följer alla symboliska länkar.
-tyst eller -qDet gör att vi kan avsluta programmet.
Med denna pdfgrep blir en idealisk lösning när du arbetar med PDF -filer i Linux -miljöer.