Elem u pitanju je izrada e-verzije Vujaklije i da ne duzim mnogo
vise informacija u ovom thread-u http://www.benchmark.co.yu/forum/showthread.php?s=&threadid=14535
a sto se tice ostalog, ovdje neka bude mjesto za organizovanje i dogovaranje u vezi izrade ...
ono sto je potrebno da se uradi je:
1. OCR vec iskeniranog teksta pomenutog rijecnika stranih rijeci.
Za onoga ko nije gledao thread za koji sam stavio link, kolega Visente
je odradio posao skeniranja i ima te skenove u vidu tif-slika, sveukupne velicine 100-ak MB. Posto bi bilo vrlo efektno da se prijavi npr. 20-ak dobrovoljaca za OCR, na svakoga bi doslo po 80-ak strana za obradu u npr. Fine reader-u ...
Imajuci u vidu da se radi o 100-ak MB svako moze da snimi kod kolege sve te skenove, ali moramo se dogovoriti ko ce sta raditi, tj. od koje do koje strane ce ko skenirati. Dakle bila bi potrebna dva-tri okupljanja,
prvo, da uzmemo skenirani materijal i drugo da obradjeni materijal vratimo Visent-u ili nekome ko ce da odradi spajanje tog obradjenog materijala. Ovo zadnje bi bilo pozeljno da uradi neko ko istovremeno radi i sa bazama podataka(ko to rece D-KEE
), jer samo spajanje nije toliko zahtjevno, a ta osoba to moze pretociti u bazu podataka i na taj nacin mozemo dobiti pravu stvar, a uz minimalnu zrtvu ucesnika, sem onoga ko bi radio bazu(tezinu tog posla ne mogu da procijenim).
Kad se odradi OCR i spajanje(mozda i baza) ne bi trebalo biti problema da se takvo sta razdijeli dalje ...
Dakle, kratak rezime
Vinsente, kazi kako da te nadjemo
, i preuzmemo skenove.
Ko preuzme skenove, neka se javi ovdije, naravno ako je voljan da ucestvuje u svemu ovome. Kad se skupi kritican broj dobrovoljaca 10-20,
napravicemo raspodijelu posla, i to bi bila prva faza
Druga faza bi bila da sacekamo nekoga ko radi sa bazama i da mu donesemo obradjeni materijal da ga on spoji i napravi bazu ... Naravno posao oko baze moze odraditi i veci broj ljudi, opet mi se cini da je tako lakse.
Elem, to bi bilo to ... jos samo jedna molba za moderatore ove rubrike
da stave ovaj thread kao "sticky' makar nedelju-dve dana dok se organizacione stvari ne obave.
Ne zamijerite na ovakvoj inicijativi, misljenja sam da se treba nesto
uraditi po ovom pitanju, jer mnogo puta mi je zafalio rijecnik str. rijeci
u elektronskom obliku, nadam se i Vama
pozdrav!
vise informacija u ovom thread-u http://www.benchmark.co.yu/forum/showthread.php?s=&threadid=14535
a sto se tice ostalog, ovdje neka bude mjesto za organizovanje i dogovaranje u vezi izrade ...
ono sto je potrebno da se uradi je:
1. OCR vec iskeniranog teksta pomenutog rijecnika stranih rijeci.
Za onoga ko nije gledao thread za koji sam stavio link, kolega Visente
je odradio posao skeniranja i ima te skenove u vidu tif-slika, sveukupne velicine 100-ak MB. Posto bi bilo vrlo efektno da se prijavi npr. 20-ak dobrovoljaca za OCR, na svakoga bi doslo po 80-ak strana za obradu u npr. Fine reader-u ...
Imajuci u vidu da se radi o 100-ak MB svako moze da snimi kod kolege sve te skenove, ali moramo se dogovoriti ko ce sta raditi, tj. od koje do koje strane ce ko skenirati. Dakle bila bi potrebna dva-tri okupljanja,
prvo, da uzmemo skenirani materijal i drugo da obradjeni materijal vratimo Visent-u ili nekome ko ce da odradi spajanje tog obradjenog materijala. Ovo zadnje bi bilo pozeljno da uradi neko ko istovremeno radi i sa bazama podataka(ko to rece D-KEE
Kad se odradi OCR i spajanje(mozda i baza) ne bi trebalo biti problema da se takvo sta razdijeli dalje ...
Dakle, kratak rezime
Vinsente, kazi kako da te nadjemo
Ko preuzme skenove, neka se javi ovdije, naravno ako je voljan da ucestvuje u svemu ovome. Kad se skupi kritican broj dobrovoljaca 10-20,
napravicemo raspodijelu posla, i to bi bila prva faza
Druga faza bi bila da sacekamo nekoga ko radi sa bazama i da mu donesemo obradjeni materijal da ga on spoji i napravi bazu ... Naravno posao oko baze moze odraditi i veci broj ljudi, opet mi se cini da je tako lakse.
Elem, to bi bilo to ... jos samo jedna molba za moderatore ove rubrike
da stave ovaj thread kao "sticky' makar nedelju-dve dana dok se organizacione stvari ne obave.
Ne zamijerite na ovakvoj inicijativi, misljenja sam da se treba nesto
uraditi po ovom pitanju, jer mnogo puta mi je zafalio rijecnik str. rijeci
u elektronskom obliku, nadam se i Vama
pozdrav!