Sådan udpakkes tekst fra et PDF-dokument

Uddrag tekst ved hjælp af Acrobat Reader

Trin 1

Åbn filen i Acrobat Reader. I Windows skal du vælge "File -> Export text document", navngive dokumentet og gemme det.

Trin 2

På et Mac- eller Linux-operativsystem skal du kopiere teksten ved at åbne menuen "Vis" og vælge "Kontinuerlig" eller "Kontinuerlig orientering". (Den første mulighed giver teksten i en kolonne, mens den anden formateres som sider side om side). Gå til "Rediger -> Vælg alle" og derefter "Rediger -> Kopier".

Trin 3

Brug værktøjet Vælg, hvis du kun vil udtrække en del af teksten. Klik på værktøjet "Vælg tekst", og vælg derefter de ønskede oplysninger. I et dokument med flere kolonner skal du bruge det første "Kolonnevalg" -værktøj. Gå til "Rediger -> Kopier"

Konverter PDF til HTML

Trin 1

Brug Gmail som en genvej. Vedhæft PDF-filen til en e-mail og send den til din Gmail-konto. Når du åbner e-mailen, vil du se en række indstillinger ud for den vedhæftede fil. Vælg indstillingen "Vis som HTML", og gem filen, der åbnes i et separat vindue. Selvom du ikke kan se grafikken, bevarer HTML-filen tekstdokumentformatet.

Trin 2

Ekstraher og konverter filerne på kommandolinjen. Linux-brugere kan bruge en grundlæggende konverteringskommando, der vil ændre en .pdf-fil til en .txt-fil: "Pdftotext filename.pdf". Sørg for at omdøbe filen med navnet på PDF-filen.

Trin 3

Download et PDF-tekstkonverteringsprogram. Der er et antal open source-programmer og gratis programmer tilgængelige, såsom PDFBox og Easy PDF to Text Converter. Mange af disse programmer kan også konvertere PDF-filer til HTML.

Interessante Artikler