Šta je novo?

Najbolji OCR

po meni najbolji je abbyy fine reader - upravo je izasla verzija 6. moze da se skine trial
http://fr5.abbyy.com/FR60PT.exe

krek ce uskoro nadam se :)
radi sve radnje, prepoznaje cirilicu, prepoznaje kolone, prepoznaje i pravi table u excelu....
 
I meni se cini da je on najbolji. Imao sam neku praistorijsku verziju ,koja je takodje radila sa cirilicom. Probao sam i omni page koji je toliko poznatiji ,al itu nesto bas nije funkcionisalo. Nisam doduse probao poslednju verziju omni page-a, mozda je ona bolja
 
Za srpski, i cirilicu i latinicu -- FineReader, bez konkurencije.
 
e to mi je trebalo.
Ovaj Omni Page OCR sto sam dobio uz skener je shvertz. Ne prepozna ni tek kucani txt kako valja!
zanci i za ponaski FineReader.....
any lnk pls?
 
Pa mogla je da se skine verzija 5.0 Try & Buy pa da se na nju aplicira odredjeni programcic u narodu poznatiji kao crack -- mada ne radi svaki kako treba, tj. kod nekih tek posle mesec dana koriscenja programa vidis da nije dobro krekovan. Medjutim, ako je izasla verzija 6... nacice se verovatno leka i za nju.
 
ne slazem se....ja vec 3-4 godine koristim recognitu (aktuelna verzija 5.0) koja savrseno radi sa cirilicom, latinicom (srpski cita skoro bez greske, sto naravno zavisi od ulaznog materijala).
 
Iz mog iskustva (a dugo sam radio sa Recognitom) mogu reci da Fine Reader-u nema ravnog. Recognita nije loša ali Fine Reader je makar za dve klase bolji.ctp;
 
Pazi, Recognitu su pravili madjari, a FineReader rusi... Sta mislis koji bolje prepoznaje cirilicu? :) Da ne gresim dusu, nisam previse radio sa Recognitom, ali znam firmu u kojoj se _intenzivno_ koristi FineReader, sa kojim je uneto vise desetina hiljada strana teksta, i ljudi imaju za njega samo reci hvale. Takodje, pomocu FR-a je prepoznat i ceo recnik srpskog jezika Matice Srpske (u desetak podebelih knjiga), sa sve onim akcentima za izgovor, tako da ne znam koja je jos preporuka potrebna.
Inace, koliko sam cuo, Recognita je sada deo Caere-a i prakticno je integrisana u OmniPage.
 
mikis je napisao(la):
Pazi, Recognitu su pravili madjari, a FineReader rusi... Sta mislis koji bolje prepoznaje cirilicu? :)

Hahahahahahahhahahahhahahahhaha..................
Ako cemo rangirati programe po tome ko ih proizvodi onda stvarno je cudo kako neki programi uopste rade :) :) :) :)
Znaci ti mislis da ako rusi prave fine reader da ce on bolje procitati cirilicu od recognite koju rade madjari?
Zanimljivo, ja sam mislio da je cirilica nesto univerzalno....ona je ista i kod rusa kada pravi doticni ili kod madjara kada rade recognitu...:)
 
ThndrKilL je napisao(la):
ne slazem se....ja vec 3-4 godine koristim recognitu (aktuelna verzija 5.0) koja savrseno radi sa cirilicom, latinicom (srpski cita skoro bez greske, sto naravno zavisi od ulaznog materijala).

Da se nastavim... hrkk :D

Razlika između Recognite i Fine Readera ima mnogo da bih ovde o svima njima pisao. Izdvojiću samo pojedine razlike za koje znam iz vlastitog iskustva. (Kada govorim o Fine Readeru - govorim o FineReader 5.0 Office verziji, koja ima znatno šire mogućnosti od FineReader Pro 5.0 verzije). Najbitnije razlike koje sam uočio bi u najkraćem bile:

Veoma bitna razlika je da u Fine Readeru možete sami napraviti svoj rečnik (User-defined languages"), koji program može koristi za prepoznavanje REČI a ne samo slova. Taj rečnik možete napraviti u nekom od wordlist makera ("Advenced wordlist editor" je po meni najbolji, a nije loš ni "Velocity Cracking Utilities") u prostom txt fajlu i importovati ga u Fine Reader.

Kod Recognite tu mogućnost nisam našao. Ona ima par default rečnika koje je sam kompanija napravila u nekakvom specifičnom formatu koji je nepristupačan za efikasno dodavanje novih reči. Među tim rečnicima nema ni ćiriličnog ni latiničnog rečnika koji bi se mogao iskoristiti za naš jezik.

Zatim, Recognita bi mi redovno "pucala" pri pokušaju "treninga" ćiriličnih karaktera koje je pogrešno (usled loše štampe) prepoznavala. Takođe nisam mogao da preko tastature unesem ćirilični karakter u tekst već bih morao da otvaram "caracter map" pa ga odatle importujem - što strašno usporava posao.

Što se tiče prepoznavanja problematičnih teksta Recognita tu veoma zaostaje za Fine Readerom. Jednom sam skenirao knjigu koja je imala prilčno mrljavu štampu (otisak je bio zamrljavljen tako da su slova bila po malo razlivena a oko njih puno tačkica i crtica). Recognita se oneredila na njemu. Ništa nije pomogao "brightness" - Recognita je jednostavno davala prepoznati tekst u takvom obliku da ga je jednostavnije bilo prekucati nego ispravljati sve greške koje je ona videla u njemu. Za razliku od toga Fine Reader je prepoznao taj (ćirilični) tekst sa beznačajnim brojem grešaka.

Kod Fine readera ima jedna vrlo korisna opcija koje nema u Recogniti. Naime u Fine Readeru možete da odaberete interfess koji ide uz vaš skener ili FineReaderov interfejs za skeniranje; a u njemu (pored ostalih podešavanja ko što ja automatski brightness) možete podesiti da skener automatski skenira beskonačan broj stranica sa mogućnošću da podesite koliku će pauzu da pravi između skeniranja svake od stranice. Ovo u praksi, kada skenirate na pr. knjigu jako puno znači jer vaš posao svodi samo na listanje novih stranica knjige eliminišući zamoran poso kljuckanja po interfejsu skenera.

Ima toga još, ali iz mog skormnog iskustva sa ova dva programa mislim da su ovo za praksu najznačajnije razlike. Ne mislim da je (i pored svih pomenutih razlika) Recognita loš program. Naprotiv, Recognita je dobar OCR program, međutim Fine Reader je bolji.

Recognita će vam obaviti dobar posao u standardnim, ne toliko profesionalnim okolnostima i u manjem obimu posla (iako ni to neće obaviti tako dobro i tako jednostavno kao Fine Reader). Ali u slučaju problematičnih tesktova; višejezičnih tekstova; tekstova u kojima je neophodno prepoznavanje mnoštva karaktera sa najrazličitijim dijakriticima (znaci za raspoznavanje pravilnog izgovora slova)na.pr. sanskrita ili akcenata; pa i ćiriličnih tekstova - Recognita ne može da parira Fine Readeru.
 
Da se nastavim... hrkk :D

Razlika između Recognite i Fine Readera ima mnogo da bih ovde o svima njima pisao. Izdvojiću samo pojedine razlike za koje znam [/B][/QUOTE]

Posto koristis Fine Reader, mozda mozes da mi pomognes. Naime, koristim Widows XP i Fine Reader 5.0 jednostavno nece da radi na njemu (iako u helpu Fine Reader-a pise da podrzava XP). Pod Windowsom 98 je radio OK.

Pozdrav
 
Carpe Diem je napisao(la):
...Naime, koristim Widows XP i Fine Reader 5.0 jednostavno nece da radi na njemu (iako u helpu Fine Reader-a pise da podrzava XP)....

otvoris note pad i napravis reg file...

[HKEY_CURRENT_USER\Software\ABBYY\Fine Objects]
"ErrorStopMode"="NEVER"
"AssertStopMode"="NEVER"

... startujes ga i to bi trebalo da ti resi problem...
 
D-KEE je napisao(la):
otvoris note pad i napravis reg file...

[HKEY_CURRENT_USER\Software\ABBYY\Fine Objects]
"ErrorStopMode"="NEVER"
"AssertStopMode"="NEVER"

... startujes ga i to bi trebalo da ti resi problem...

I resilo je. Sad fercera. :)
 
Fine Reader

Jedino je finereader uspeo da mi bez i jedne greske prepozna dvadeset strana mesanog teksta srpske cirilice i engleske latinice. Pri tome je sve bil u tabelama koje je takodje prepoznao a ja sam samo pasteovao u word.
 
D-KEE je napisao(la):
po meni najbolji je abbyy fine reader - upravo je izasla verzija 6. moze da se skine trial
http://fr5.abbyy.com/FR60PT.exe

krek ce uskoro nadam se :)
radi sve radnje, prepoznaje cirilicu, prepoznaje kolone, prepoznaje i pravi table u excelu....

Ova nova verzija nema nista od jezika za prepoznavanje osim engleskog i "digits". Ne znam da li je to sto je trial........
Sto se tice programa uopste koristio sam do sad Abby 5.0 i prezadovoljan sam, a koliko mi se cini ova 6.0 nema neke velike promene osim sminke.
 
flojd je napisao(la):
Ova nova verzija nema nista od jezika za prepoznavanje osim engleskog i "digits". Ne znam da li je to sto je trial........
Sto se tice programa uopste koristio sam do sad Abby 5.0 i prezadovoljan sam, a koliko mi se cini ova 6.0 nema neke velike promene osim sminke.

imas na sajtu da skines dodatno podrsku za raznorazne jezike...
 
Nadam se da je O.K. što ovu prastaru temu dižem iz mrtvih, da ne otvaram novu temu. Jučer sam testirao tri OCR softwera, Abby Finereader 16, Readiris 17 i Omnipage 18. Testiranje sam proveo tako što sam svakom programu zadao da "pročita" istu količinu teksta i exportira ga u Word dokument. Tekst koji su "čitali" bile su tri skenirane stranice knjige Razgovor u katedrali, autor Mario Vargas Llosa. Najbolji mi se pokazao Omnipage, koji je u cijelom tom tekstu od tri stranice imao samo jednu grešku, poslije njega je bio Abby Finereader i najlošiji mi se pokazao Readiris 17, koji je napravio čak i ozbiljniju grešku, koja je dovela u pitanje čitljivost riječi. Ako pravila dozvoljavaju, postavio bih link na te dokumente, tako da možete vidjeti gdje su pogriješili.
 
što se free alata tiče, najbolje mi prepoznaje onaj ugrađeni u Windows snipping tool: uhvatiš screenshot nečega i imaš u edit opciji gore da izvuče tekst. Nisam siguran ali deluje da koristi neki AI. Primer:
 

Prilozi

  • Screenshot 2024-12-01 150559.png
    Screenshot 2024-12-01 150559.png
    130 KB · Pregleda: 15
Nazad
Vrh Dno