Sådan udpakkes tekst fra et PDF-dokument
Uddrag tekst ved hjælp af Acrobat Reader
Trin 1
Åbn filen i Acrobat Reader. I Windows skal du vælge "File -> Export text document", navngive dokumentet og gemme det.
Trin 2
På et Mac- eller Linux-operativsystem skal du kopiere teksten ved at åbne menuen "Vis" og vælge "Kontinuerlig" eller "Kontinuerlig orientering". (Den første mulighed giver teksten i en kolonne, mens den anden formateres som sider side om side). Gå til "Rediger -> Vælg alle" og derefter "Rediger -> Kopier".
Trin 3
Brug værktøjet Vælg, hvis du kun vil udtrække en del af teksten. Klik på værktøjet "Vælg tekst", og vælg derefter de ønskede oplysninger. I et dokument med flere kolonner skal du bruge det første "Kolonnevalg" -værktøj. Gå til "Rediger -> Kopier"
Konverter PDF til HTML
Trin 1
Brug Gmail som en genvej. Vedhæft PDF-filen til en e-mail og send den til din Gmail-konto. Når du åbner e-mailen, vil du se en række indstillinger ud for den vedhæftede fil. Vælg indstillingen "Vis som HTML", og gem filen, der åbnes i et separat vindue. Selvom du ikke kan se grafikken, bevarer HTML-filen tekstdokumentformatet.
Trin 2
Ekstraher og konverter filerne på kommandolinjen. Linux-brugere kan bruge en grundlæggende konverteringskommando, der vil ændre en .pdf-fil til en .txt-fil: "Pdftotext filename.pdf". Sørg for at omdøbe filen med navnet på PDF-filen.
Trin 3
Download et PDF-tekstkonverteringsprogram. Der er et antal open source-programmer og gratis programmer tilgængelige, såsom PDFBox og Easy PDF to Text Converter. Mange af disse programmer kan også konvertere PDF-filer til HTML.