(ФОТО) НОВОСАДСКИ ИНСТИТУТ ЗА АИ ЛИДЕР ИНОВАЦИЈА Развијају програме за интеракцију са рачунарима на српском језику
Истраживачко-развојни институт за вештачку интелигенцију (АИ, Артифициал Intelligence) ради на пројектима који се тичу уклањања сензитивних података, али и једноставнијој и бржој претрази информација.
Истраживачи развијају рачунарски програма за препознавање говора за српски језик, за семантичку прераду и анонимизацију текста.
Горана Гојић истраживач Института је део групе која се бави интеракцијом човека и рачунара. Ради на пројектима који се тичу обраде српског језика.
- Семантичка претрага се односи на то да практично модел разуме текст написан у форми језика који му дате и да може да нам врати неке информације на основу тога. Конкретно, ви поставите питање, јер постоји база одговора и модел вам врати релевантне одговоре - појаснила је Гојић.
Горана Гојић је истраживач на Институту, је prеthodno радила на ФТН-у и тамо је започела докторске студије које су биле из области примене вештачке интелигнеције. Пожелела је више времена да посвети истраживању како би се усавршила и у тој грани, па се указала прилика да дође у Институт.
Рецимо, питате га о Дану државности и он вам излиста првих пет одговора који се тичу те две речи.
- Одговори не морају конкретно да садрже синтагму Дан државности, него вам модел врати све одговоре који имају везе са те две синтагме. Анонимизација текста, подразумева уклањање из текста података који се сматрају сензитивним. На пример, имена, презимена, адресе, број личне карте, ЈМБГ и слично. Примена тога би била између осталих и у медицини. Рецимо некада желите да уклоните име и презиме, а да остатак података користите за статистику. Уколико желите да сазнате који део популације има одређену болест у земљи – каже Гојић.
Владимир Винцан, истраживач приправник, у Институту се, како каже за наше новине, бави препознавачем говора за српски језик.
- Хоћемо да развијемо систем који ће бити користан и за ширу употребу не само за специјализоване намене. У овај пројекат смо кренули како би се завршила дигитализација архива Радио телевизије Србије који садржи хиљаде и хиљаде сати непроцесираних аудио и видео материјала - каже Винцан.
Владимир Винцан је завршио електротехнику, специјализовао се за електронику. Био је како каже две и по године асистент на факултету и онда је одлучио да жели више да се бави истраживачким радом. Уписао је и докторске студије.
Наиме, како каже уколико би смо желели да пронађемо неки снимак из ранијих година морали би ручно да пролазимо кроз сав тај материјал, што је веома исцрпљујући процес.
- Ако би смо добили транскрипте свих тих материјала могли би смо да укуцамо кључне речи, а уз помоћ семантичке претраге, коју такође развијамо на Институту могли би да пронађемо оно што нам треба. Друга намена је да свако од нас више не мора да користи тастатуру, већ уз помоћ рачунарског програма говор је аутоматски препознат и преведен у писани текст. Може да се користи у другим установама, рецимо у образовању. Све што професор каже на предавању би могло аутоматски да буде и записано, а самим тим би ђаци могли добијти тај материјал – појаснио је наш саговорник.
С. Аничић Илић
Фото: Р. Хаџић