Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux

Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux
Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux

Video: Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux

Video: Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux
Video: 7 Ways To Adjust the Colors On Your Mac's Screen - YouTube 2024, Balandis
Anonim
Yra keletas priežasčių, kodėl galbūt norėsite konvertuoti PDF rinkmeną į redaguojamą tekstą. Galbūt jūs turėsite peržiūrėti seną dokumentą, o visa tai yra PDF versija. "PDF" failų konvertavimas "Windows" yra lengvas, bet kas, jei naudojate "Linux"?
Yra keletas priežasčių, kodėl galbūt norėsite konvertuoti PDF rinkmeną į redaguojamą tekstą. Galbūt jūs turėsite peržiūrėti seną dokumentą, o visa tai yra PDF versija. "PDF" failų konvertavimas "Windows" yra lengvas, bet kas, jei naudojate "Linux"?

Nesijaudink. Mes parodysime, kaip lengvai konvertuoti PDF failus į redaguojamąjį tekstą naudodami komandinės eilutės įrankį pdftotext, kuris yra "poppler-utils" paketo dalis. Šis įrankis jau gali būti įdiegtas. Norėdami patikrinti, ar jūsų sistemoje įdiegta pdftotext, paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą. Lauke įveskite šią komandą ir paspauskite "Enter".

dpkg –s poppler-utils

PASTABA: kai mes sakome įvesti kažką šiame straipsnyje ir yra kabučių aplink tekstą, NENURODYKITE citatos, nebent nurodome kitaip.

Jei pdftotext neįdiegtas, įveskite šią komandą eilutėje ir paspauskite "Enter".
Jei pdftotext neįdiegtas, įveskite šią komandą eilutėje ir paspauskite "Enter".

sudo apt-get install poppler-utils

Įveskite slaptažodį, kai pasirodys raginimas, ir paspauskite "Enter".

"Poppler-utils" paketui yra keli įrankiai, skirti konvertuoti PDF į įvairius formatus, manipuliuoti PDF failais ir išgauti informaciją iš failų.
"Poppler-utils" paketui yra keli įrankiai, skirti konvertuoti PDF į įvairius formatus, manipuliuoti PDF failais ir išgauti informaciją iš failų.
Toliau pateikiama pagrindinė komanda, skirta PDF failo konvertavimui į redaguojamą teksto failą. Paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą, įveskite komandą eilutėje ir paspauskite "Enter".
Toliau pateikiama pagrindinė komanda, skirta PDF failo konvertavimui į redaguojamą teksto failą. Paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą, įveskite komandą eilutėje ir paspauskite "Enter".

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Pakeiskite kiekvieno failo kelią, kad jis atitiktų pradinio PDF failo vietą ir pavadinimą, ir kur norite išsaugoti gaunamą teksto failą. Taip pat pakeiskite failų vardus, kad jie atitiktų jūsų failų pavadinimus.

Teksto failas yra sukurtas ir jį galima atidaryti taip, kaip atidarote bet kurį kitą tekstinį failą "Linux".
Teksto failas yra sukurtas ir jį galima atidaryti taip, kaip atidarote bet kurį kitą tekstinį failą "Linux".
Pertvarkytas tekstas gali turėti eilučių pertraukas tose vietose, kuriose nenorite. Linijos pertraukos įterpiamos po kiekvienos PDF teksto eilutės teksto.
Pertvarkytas tekstas gali turėti eilučių pertraukas tose vietose, kuriose nenorite. Linijos pertraukos įterpiamos po kiekvienos PDF teksto eilutės teksto.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Jei norite PDF failus redaguoti tik puslapių asortimentą, naudokite "-f" ir "-l" (mažosios raidės "L") vėliavėlę, norėdami nurodyti pirmąjį ir paskutinį puslapius, kuriuos norite konvertuoti.
Jei norite PDF failus redaguoti tik puslapių asortimentą, naudokite "-f" ir "-l" (mažosios raidės "L") vėliavėlę, norėdami nurodyti pirmąjį ir paskutinį puslapius, kuriuos norite konvertuoti.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Norėdami konvertuoti PDF failą, kuris saugomas ir užšifruotas su savininko slaptažodžiu, naudokite "-opw" vėliavą (pirmasis ženklas vėliava yra mažoji raidė "O", o ne nulis).
Norėdami konvertuoti PDF failą, kuris saugomas ir užšifruotas su savininko slaptažodžiu, naudokite "-opw" vėliavą (pirmasis ženklas vėliava yra mažoji raidė "O", o ne nulis).

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Pakeiskite "slaptažodį" į tą, kuris naudojamas norint apsaugoti originalų PDF failą, kuris yra konvertuojamas. Įsitikinkite, kad aplink "slaptažodį" yra vienkartinės kabutės, o ne dvigubos.

Jei PDF failas yra apsaugotas ir užšifruotas vartotojo slaptažodžiu, naudokite "-upw" vėliavėlę, o ne "-opw". Likusi komanda yra ta pati.
Jei PDF failas yra apsaugotas ir užšifruotas vartotojo slaptažodžiu, naudokite "-upw" vėliavėlę, o ne "-opw". Likusi komanda yra ta pati.
Taip pat galite nurodyti pabaigos eilutės simbolio tipą, kuris taikomas konvertuotam tekstui. Tai ypač naudinga, jei planuojate pasiekti failą kitoje operacinėje sistemoje, pvz., "Windows" arba "Mac". Norėdami tai padaryti, naudokite vėliavėlę "-eol" (vidurinis ženklas vėliavoje yra mažoji raidė "O", o ne nulis), po kurios nurodomas tarpas ir norimos naudoti pabaigos simbolio tipas (" unix "," dos "arba" mac ").
Taip pat galite nurodyti pabaigos eilutės simbolio tipą, kuris taikomas konvertuotam tekstui. Tai ypač naudinga, jei planuojate pasiekti failą kitoje operacinėje sistemoje, pvz., "Windows" arba "Mac". Norėdami tai padaryti, naudokite vėliavėlę "-eol" (vidurinis ženklas vėliavoje yra mažoji raidė "O", o ne nulis), po kurios nurodomas tarpas ir norimos naudoti pabaigos simbolio tipas (" unix "," dos "arba" mac ").
PASTABA: jei nenurodysite teksto failo pavadinimo, pdftotext automatiškai naudoja PDF failo pavadinimą ir prideda ".txt" plėtinį. Pavyzdžiui, "file.pdf" bus konvertuotas į "file.txt". Jei teksto failas yra nurodytas kaip "-", konvertuotas tekstas siunčiamas į stdout, o tai reiškia, kad tekstas rodomas terminalo lange ir neišsaugomas į failą.
PASTABA: jei nenurodysite teksto failo pavadinimo, pdftotext automatiškai naudoja PDF failo pavadinimą ir prideda ".txt" plėtinį. Pavyzdžiui, "file.pdf" bus konvertuotas į "file.txt". Jei teksto failas yra nurodytas kaip "-", konvertuotas tekstas siunčiamas į stdout, o tai reiškia, kad tekstas rodomas terminalo lange ir neišsaugomas į failą.

Norėdami uždaryti terminalo langą, spustelėkite mygtuką "X" viršutiniame kairiajame kampe.

Norėdami gauti daugiau informacijos apie komandą pdftotext, lauke Terminas įveskite "man page pdftotext".

Rekomenduojamas: