Šta je novo?

Kopiranje iz PDF-a?

STriderKOCOBO

Slavan
Učlanjen(a)
25.04.2009
Poruke
3,644
Poena
435
Nikako ne mogu da prekopiram tekst iz sledećeg pdf dokumenta: https://app.box.com/s/pe7ek55tw2apzfwfe5ul

Pokušao sam sve - prvo sam ga konvertovao sam ga u .doc format ali je rezultat katastrofalan, pokušao sam sa raznim OCR programima i dobio tekst prepun grešaka zato što takvi programi ne prepoznaju dobro znakove poput vitičastih zagrada i pravi im problem watermark koji se nalazi na skoro svakoj strani, otključao sam ga ali kada kopiram dobijem hijeroglife poput ovih:
,PNQPOFOUB UJQB_H )QSFETUBWMKB [BQSBWP QSP[PS QSBWPH FEJ
UPSB UFLTUB .FʇVUJN
[CPH SFMBUJWOP TLSPNOJI NPHVʂOPTUJ [B VSFʇJWBOKF
UFLTUB
PWB LPNQPOFOUB TF TLPSP VWFL LPSJTUJ TBNP [B QSJLB[JWBOKF UFLTUB
UK OKFOP TWPKTUWPH #PCJʃOP TF QPEFØBWB EB CVEF3#

Ima li nekog rešenja za ovaj problem?

 
Džabe, i preko ovog prvog kad otključam i kad kopiram nešto izbacuje hijeroglife:
/BHMBTBL V PWPK LOKJ[J KF VHMBWOPN OB OBQSFEOJKJN NPHVʂOPTUJNB +BWF
P LPKJNB TF HPWPSJ V ESVHPN EFMV LOKJHF "MJ [CPH UPHB TF PE ʃJUBMBDB PʃFLV
KF PESFʇFOP QSFE[OBOKF P PTOPWOJN LPODFQUJNB QSPHSBNJSBOKB 4QFDJđʃ
OP
QSFUQPTUBWMKB TF EB ʃJUBPDJ EPCSP QP[OBKV PTOPWOF FMFNFOUF QSPHSBNJ
SBOKB LBP ØUP TV QSPNFOMKJWF J UJQPWJ QPEBUBLB
 
Sad sam probao i kod mene radi, e sad ako hoćeš cele strane da kopiraš onda moraš da skineš ovaj glupi watermark.
 
Radi samo prva strana, od sadržaja pa na dalje ne može da se iskopira ni jedna jedina reč.
Tako je sa svim unlockerima koje sam probao.

Potpuno isti slučaj i sa ovom drugom knjigom: link, ništa posle sadržaja ne može da se kopira.
 
Radi samo prva strana, od sadržaja pa na dalje ne može da se iskopira ni jedna jedina reč.
Tako je sa svim unlockerima koje sam probao.

Potpuno isti slučaj i sa ovom drugom knjigom: link, ništa posle sadržaja ne može da se kopira.
Pa naravno da nemože da se kopira text, to je samo slika texta, moraćeš da proturiš kroz OCR program.
 
Da je slika ne bi mogao da se markira tekst...
Ništa, na kraju ću prekucati delove koji mi trebaju
 
Može.. svako slovo mala sličica.. Viđao sam takve pdf fajlove.
 
SECURED - samo idi na ovu adresu http://www.crackmypdf.com/ i pošalji dokument, sačekaj i skini otključanu verziju ...
Watermark(s) - Foxit Phantom-om ukloniš, on je dobar jer ih skine sve odjednom za razliku od PDFedit-a npr.

Sad bi neki OCR program trebalo da to opegla bez problema. Dok sam testirao, onu prvu knjigu sam oslobodio passworda i watermarkova: obrisan pa možeš da nastaviš odatle.

EDIT: provukao i kroz Abby Fine Reader i da, može se kopirati, prepoznato preko 95% teksta a greške su se dešavale tamo gde je program bivao zbunjen različitim jezicima - uglavnom ništa što se tokom kopiranja ne može ispraviti. Ja ću link sa gornjim fajlom obrisati nadajući se da si ga već skinuo, ipak se njime krši licenca za knjigu što sam tek malopre video ;).
 
Poslednja izmena:
I Adobe Reader Pro skida watermark odjednom samo je malo teži za nalaženje narodne verzije ...
Skinuo sam sad Foxit Advanced PDF Editor v3.1.0 da probam kako radi :)

Ukratko :
SECURED: http://www.crackmypdf.com/
Watermark: Adobe Reader Pro ili Foxit Advanced PDF Editor
OCR: ABBYY FineReader
 
Ja sam ga već koristio i istekao mi je trial, videću za vikend da nađem narodnu verziju. Za OCR sam koristio Microsoft One Note, ali često greši sa simbolima, dok tekst prepoznaje prilično tačno.
 
Za ocr ništa osim najnovijeg abbyy fine readera. Charset na automatic i nema brige.
 
Po koliko ste plaćali abbyy igde ste ga nabavili?
 
Po koliko ste plaćali abbyy igde ste ga nabavili?
Eh, mnogo pitaš. Ima da se kupi i da se "kupi" na internetu (u zavisnosti koliko je neko puritanac) samo mora da ima i rečnik i thesaurus za dati jezik dabi sam moga da detektuje i ispravi greške u čitanju.
 
Poslednja izmena od urednika:
Nazad
Vrh Dno