Šta je novo?

Srpski TTS model - da li je vreme za ozbiljan nacionalni projekat?

PanonskiNS

Slavan
Učlanjen(a)
27.11.2009
Poruke
1,869
Poena
435
Srbija ima određene TTS implementacije za srpski jezik, uglavnom u zatvorenim ili specifičnim sistemima, ali trenutno ne postoji široko dostupan, moderan i kvalitetan TTS model koji bi mogao da se koristi u širem AI ekosistemu i da zvuči prirodno.

U međuvremenu, globalni modeli na engleskom su već na nivou vrlo prirodnog ljudskog govora.

Pitanje je da li bi Srbija, kroz saradnju države, akademije i IT industrije, trebalo da razvije ozbiljan i otvoren (ili polu-otvoren) TTS model za srpski jezik.

Da li kao tech zajednica možemo da artikulišemo realan predlog koji bi mogao da dođe do institucija i decision makera?

Zanima me mišljenje ljudi ovde: da li ovakav projekat ima strateški smisao i ko bi realno mogao da ga nosi?
 
Srbija ima određene TTS implementacije za srpski jezik, uglavnom u zatvorenim ili specifičnim sistemima, ali trenutno ne postoji široko dostupan, moderan i kvalitetan TTS model koji bi mogao da se koristi u širem AI ekosistemu i da zvuči prirodno.

U međuvremenu, globalni modeli na engleskom su već na nivou vrlo prirodnog ljudskog govora.

Pitanje je da li bi Srbija, kroz saradnju države, akademije i IT industrije, trebalo da razvije ozbiljan i otvoren (ili polu-otvoren) TTS model za srpski jezik.

Da li kao tech zajednica možemo da artikulišemo realan predlog koji bi mogao da dođe do institucija i decision makera?

Zanima me mišljenje ljudi ovde: da li ovakav projekat ima strateški smisao i ko bi realno mogao da ga nosi?
 
Ulagali su velike pare u Alfanum projekat (vlada) pre neku godinu. Ali ne znam šta je od toga bilo? Za obične korisnike, ništa.
 
Alfanum koliko znam je komercijalan tj nema za bilo koga da puste kao što je na primer Qwen tts pre nedelju dana,10 svetskih jezika, sve prirodno zvuči, besplatno.
Vidim reference za Alfanum ovde
 
Da Qwen 3 TTS https://huggingface.co/spaces/Qwen/Qwen3-TTS https://github.com/QwenLM/Qwen3-TTS
odličan, ali nema srpski već tih 10 jezika.
Probao sam dosta TTS i voice cloning modela, Microsoft Vibe Voice 7B model je tu i tamo za kloniranje na srpskom je bio OK. ali se zaglupi posle nekoliko rečenica. Imaš u Google AI Studiju, prilično prirodan srpski TTS. https://aistudio.google.com/prompts/new_chat

daleko smo od srpskog open-source, na žalost.

Možeš da probaš i Microsoft Edge TTS neural glasove, ima srpski bosanski i hrvatski, iako nisu loši daleko ispod QWEN i Google AI Studio vokala
 
Taj primer saradnje države i privrede mi deluje ohrabrujuće. Uliva nadu da bi mogla da se izgradi ozbiljna infrastruktura: prikupljanje kvalitetnog dataset-a, uključivanje naučnika i inženjera, treniranje modela u domaćim data centrima i strateško ulaganje na nivou miliona evra.

Ako bi takav model kasnije bio dostupan za širu upotrebu, to bi moglo da ima ogroman uticaj na razvoj domaćeg IT ekosistema.

Velika je razlika između oslanjanja na sopstveni model i zavisnosti od tuđih API-ja gde plaćaš po potrošnji, nemaš punu kontrolu nad sistemom i stalno zavisiš od spoljne infrastrukture i internet konekcije.
 
YUP. Počeli su da rade na digitalizaciji intenzivno, bilo je u nekoj emisiji. Verovatno interno obučavaju OCR, Speech recognition i Text to Speech modele. Da ne pomenem Face Recognition modele, za camera surveillance. Biće zeznuta priča sa AI kamerama.
Ali najverovatnije će najbolje modele oni čuvati za sebe i svoje centre, dok nama MOŽDA ostave prototipe ili drastično kvantizovane i distilovane verzije jednog dana. Pa ni normalan čitač LK nemamo a da ne instalira gomilu sertifikata u trusted root. (neke python biblioteke ne rade zbog toga), i nikako da isprave.

Svi sada ulažu u AI. Pre neki dan majci nisam mogao da podignem lek(dodatnu kutiju) u apoteci, AI izbacio da ima viška tableta u prepisanom receptu, WTF?!?
 
Poslednja izmena:
Aj pojasni ovo ( neke python biblioteke ne rade zbog toga ) jer sada kada premotam posle instalacije LK citača stvarno par njih u pythonu mi nije radilo.
 
U samom thread-u (migrirano iz bugs.python.org) korisnici iz Srbije objašnjavaju da su ti “MUPCA Root” sertifikati “nužni … da se čitaju lične karte i koriste sertifikati” i da problem “pogađa broj Python aplikacija”, uz konkretne primere (npr. QGIS, Fusion 360), jer Python na Windowsu pri ssl.create_default_context() učitava cert store i “pukne” na “lošem” sertifikatu (npr. ssl.SSLError: not enough data: cadata does not contain a certificate). 2

Povezani GitHub issue koji se u tom thread-u navodi kao “reproducer” (Python apps pucaju kada Windows cert store sadrži “bad certificates”) je ovaj:

<span><span>yt-dlp/yt-dlp — Issue #1060</span></span><br><span><span>SSLError when windows cert store contains bad certificates</span></span><br><span><span>https://github.com/yt-dlp/yt-dlp/issues/1060</span></span>
  • GitHub Issue: jupyter/notebook #42451
    • Konkretan komentar: Korisnik rupurut je 28.12 avgusta 2019.2 napisao: "If you happen to use ASSECO 24x7 banking app, then you need to exclude those certificates as well, cause they seem to have the same issue."
Pored toga, ovaj problem je detaljno dokumentovan i na Dropbox Community forumu (jer Dropbox koristi Python), gde je povezan sa zvaničnim Python bug-om:

  • Python Bug Tracker: Issue 35665 - ssl.SSLError: nested asn1 error13
    • Ovde je tehnički objašnjeno da stariji/loše generisani sertifikati (koje koristi MUP i domaće banke) imaju neispravnu ASN.1 strukturu koja ruši OpenSSL (biblioteku koju Python koristi).1

Šta je zapravo problem?​

Kada instaliraš softver za lične karte (Čelik) ili e-banking rešenja domaćih banaka (Asseco), oni u tvoj Windows "Trusted Root Certification Authorities" ubacuju sertifikate koji nisu u skladu sa strogim standardima koje očekuju moderne verzije OpenSSL-a (koji Python koristi).

Problematični sertifikati su najčešće:

  1. 24x7.co.yu Root CA (Najčešći krivac, koristi ga Asseco softver za banke)1
  2. 24x7.co.yu Digitrust CA1
  3. MUPCARoot (u nekim starijim verzijama)1

Simptomi​

Kada pokušaš da koristiš pip install, requests.get() ili pokreneš Python aplikaciju (kao Dropbox ili Jupyter), dobijaš grešku:

ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: nested asn1 error (_ssl.c:xxxx)1

Rešenje koje zajednica predlaže​

Jedino trajno rešenje koje korisnici prijavljuju je brisanje ovih sertifikata iz Windows-a kada se ne koriste (ili korišćenje certmgr.msc da se oni privremeno uklone/onemoguće dok programiraš u Python-u).1

Alternativno, za čitanje lične karte na Linux-u i Mac-u (a radi i na Windows-u bez instalacije celog MUP bloatware-a), domaća zajednica je napravila open-source rešenje koje ne pravi ove probleme:

 
Root sertifkat je odavno istekao i treba ga svakako brisati, čak nije ni dostupan za preuzimanje više, tu je samo RootCA4, a i sama aplikacija za čitanje LK radi i bez instaliranih sertifkata, potrebni su samo Čelik i TrustEdge, sertifkati se koriste za autentikaciju i potpisivanje.
I slažem se da će država pre trenirati Ai model da bolje radi sa kineskim softverom za prepoznavanje lica nego da ulaže u TTS.
 
Nazad
Vrh Dno