Hur man extraherar text från en PDF -fil i macOS Sierra

Innehållsförteckning

Ett av de mest använda aktuella formaten för överföring av information är PDF (Portable Document Format - Portable Document Format) som har utvecklats av Adobe och erbjuder oss många fördelar såsom:

  • Större dokumentsäkerhet
  • Minskning av originalstorlek
  • Kompatibilitet med flera enheter
  • Bevarar integriteten hos bland annat lagrade data.

Poängen är att vi vid vissa tillfällen och av flera skäl uteslutande måste extrahera textens innehåll från PDF -filen utan att inkludera andra element som bilder eller signaturer.

Solvetic kommer att analysera hur du enkelt utför denna process i macOS Sierra utan att använda extra verktyg.

Steg 1
Öppna dokumentet: Det första steget att ta är att öppna PDF -dokumentet som lagras lokalt i macOS Sierra, vilket görs automatiskt med verktyget Förhandsgranskning:

Det är viktigt att förtydliga att om vi använder olika verktyg som Adobe Reader öppnas PDF -filen med det verktyget.

Steg 2
Textval: Nu fortsätter vi att kopiera informationen från PDF -filen som vi normalt gör med musen, men om vi har flera PDF -filer är det en tidskrävande uppgif.webpt.

Vi kan använda en av följande metoder för att göra denna process mycket effektivare:

  • Gå till menyn Redigera och välj där alternativet Välj alla
  • Använd tangentkombinationen ⌘ + A
.

När vi väl valt det här alternativet ser vi den markerade texten:

Steg 3
Kopiera och klistra in innehållet: När texten i PDF -filen har valts fortsätter vi att kopiera den med något av följande alternativ.

Kopiera PDF -text

  • Gå till menyn Redigera och välj Kopiera
  • Använd tangentkombinationen ⌘ + C

När vi har denna information på Urklipp öppnar vi TextEdit -programmet med något av följande alternativ

  • Ange ordet text i Spotlight och välj där TextEdit
  • Gå till sökvägen go / Applications och välj där TextEdit

Följande fönster visas. Där väljer vi knappen Nytt dokument.

Steg 4
I det nya fönstret går vi till menyn Format och där väljer vi alternativet Konvertera till vanlig text eller så kan vi använda tangentkombinationen ⇧ + ⌘ + T. Resultatet blir följande:

Med denna enkla metod kan vi enkelt extrahera texten från nödvändiga PDF -filer.

wave wave wave wave wave