Šta je novo?

PDF dokumenti

Razne trial verzije mi nisu rešenje jer se ne radi o jednokratnom poslu. Scenario je sledeći: korisnici moje aplikacije periodično dobijaju važne informacije u PDF fajlu. Da ih ne bi prekucavali u aplikaciju treba da kod njih instaliram nešto što će konvertovati taj PDF u TXT, a što treba da radi i dogodine, a ne da mu traži plaćanje posle par meseci. Aplikacija učitava taj TXT, analizira ga i izvlači tražene podatke.
 
bez Acrobat-a il' Abbyy (il' nečega sličnog) nema sigurnog rezultata. možeš da probaš kakav rezultat daje Libre Office - Draw može da importuje pdf i da ga exportuje kao html. onda bi morao iz html da radiš konverziju u txt (il' program da modifikuješ da može da radi to što radi nad html fajlom.

ako ti je na rasploaganju Word, probaš kakav rezultat daje otvaranje pdf fajla u njemu. ja sam u par navrata dobijao rezultate u rangu exporta iz Acrobat-a
 
Brine me ovo "nema sigurnog rezultata". Mada je reč o relativno jednostavnoj stvari. Pdf fajl sadrži tabelu, koja nema uvek isti broj redova niti su mi svi redovi u tabeli od značaja. Posle konverzije u tekst imam, na primer, pored ostalog sledeći red:
"Основица за плаћање пореза 3,003,460.07 2,899,757.17 103,702.90 0.00".
Treba da prepoznam tekst "Основица за плаћање пореза" a zatim obradim numeričke podatke iza tog teksta. I tako za još pedesetak redova od nekoliko stotina koliko ih je u tabeli. Nadam se da SumatraPDF neće zabrljati u smislu da pobrka redove originalnog teksta, jer to je sve što mi treba. Inače džaba rad jer sam već napisao kod i isprobao ga na ovom jednom test primeru.
 
Poslednja izmena:
Vrh Dno