(FOTO) NOVOSADSKI INSTITUT ZA AI LIDER INOVACIJA Razvijaju programe za interakciju sa računarima na srpskom jeziku
Istraživačko-razvojni institut za veštačku inteligenciju (AI, Artificial Intelligence) radi na projektima koji se tiču uklanjanja senzitivnih podataka, ali i jednostavnijoj i bržoj pretrazi informacija.
Istraživači razvijaju računarski programa za prepoznavanje govora za srpski jezik, za semantičku preradu i anonimizaciju teksta.
Gorana Gojić istraživač Instituta je deo grupe koja se bavi interakcijom čoveka i računara. Radi na projektima koji se tiču obrade srpskog jezika.
- Semantička pretraga se odnosi na to da praktično model razume tekst napisan u formi jezika koji mu date i da može da nam vrati neke informacije na osnovu toga. Konkretno, vi postavite pitanje, jer postoji baza odgovora i model vam vrati relevantne odgovore - pojasnila je Gojić.
Gorana Gojić je istraživač na Institutu, je prethodno radila na FTN-u i tamo je započela doktorske studije koje su bile iz oblasti primene veštačke intelignecije. Poželela je više vremena da posveti istraživanju kako bi se usavršila i u toj grani, pa se ukazala prilika da dođe u Institut.
Recimo, pitate ga o Danu državnosti i on vam izlista prvih pet odgovora koji se tiču te dve reči.
- Odgovori ne moraju konkretno da sadrže sintagmu Dan državnosti, nego vam model vrati sve odgovore koji imaju veze sa te dve sintagme. Anonimizacija teksta, podrazumeva uklanjanje iz teksta podataka koji se smatraju senzitivnim. Na primer, imena, prezimena, adrese, broj lične karte, JMBG i slično. Primena toga bi bila između ostalih i u medicini. Recimo nekada želite da uklonite ime i prezime, a da ostatak podataka koristite za statistiku. Ukoliko želite da saznate koji deo populacije ima određenu bolest u zemlji – kaže Gojić.
Vladimir Vincan, istraživač pripravnik, u Institutu se, kako kaže za naše novine, bavi prepoznavačem govora za srpski jezik.
- Hoćemo da razvijemo sistem koji će biti koristan i za širu upotrebu ne samo za specijalizovane namene. U ovaj projekat smo krenuli kako bi se završila digitalizacija arhiva Radio televizije Srbije koji sadrži hiljade i hiljade sati neprocesiranih audio i video materijala - kaže Vincan.
Vladimir Vincan je završio elektrotehniku, specijalizovao se za elektroniku. Bio je kako kaže dve i po godine asistent na fakultetu i onda je odlučio da želi više da se bavi istraživačkim radom. Upisao je i doktorske studije.
Naime, kako kaže ukoliko bi smo želeli da pronađemo neki snimak iz ranijih godina morali bi ručno da prolazimo kroz sav taj materijal, što je veoma iscrpljujući proces.
- Ako bi smo dobili transkripte svih tih materijala mogli bi smo da ukucamo ključne reči, a uz pomoć semantičke pretrage, koju takođe razvijamo na Institutu mogli bi da pronađemo ono što nam treba. Druga namena je da svako od nas više ne mora da koristi tastaturu, već uz pomoć računarskog programa govor je automatski prepoznat i preveden u pisani tekst. Može da se koristi u drugim ustanovama, recimo u obrazovanju. Sve što profesor kaže na predavanju bi moglo automatski da bude i zapisano, a samim tim bi đaci mogli dobijti taj materijal – pojasnio je naš sagovornik.
S. Aničić Ilić
Foto: R. Hadžić