Sådan konverteres PDF til almindelig tekst med pdftotext

Denne vejledning viser instuctions om at konvertere PDF til TXT med pdftotext utility. pdftotext er allerede indbygget i Ubuntu sammen med Poppler-utils pakke. Takket være Poppler Project og Glyph & Cog for at levere dette værktøj.

Konvertering som er

pdftotext <pdf_file_name> <txt_file_name>

Forklaring: Denne kommandolinje konverterer hele sider af pdf_file_name til en enkelt fil txt_file_name.

Konvertering med følgende originale tekstlayout

pdftotext -layout <pdf_file_name> <txt_file_name>

Forklaring: Denne kommandolinje med -layout-option vil tvinge txt_file_name til at have samme tekstlayout med det originale pdf-layout.

Konvertering af PDF til HTML

pdftotext -htmlmeta <pdf_file_name> <html_file_name>

Forklaring: Denne kommandolinje konverterer pdf_file_name til en HTML-fil.

Konverterer kun bestemte sider

pdftotext -f <number> -l <number> <pdf_file_name> <txt_file_name>

Forklaring: Denne kommandolinje angiver det første sidetal (-f) og det sidste (-l), der skal konverteres.

Juster slutningen af ​​linjen til et andet OS formål

pdftotext -eol dos <pdf_file_name> <txt_file_name> pdftotext -eol unix <pdf_file_name> <txt_file_name> pdftotext -eol mac <pdf_file_name> <txt_file_name>

Forklaring: Den første kommandolinje er egnet, hvis du vil læse TXT i Windows. Den anden er egnet i GNU / Linux og en anden UNIX-familie. Den tredje er velegnet til Mac OS.

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.