YugoGPT је лансиран 25. децембра, а за првих 24 сата је прикупио 1.250 регистрованих корисника. Има веома сличан интерфејс као и ChatGPT, с тим што иза њега стоји језички модел трениран специфично на српским, босанским, црногорским и хрватским подацима.
Иако најпопуларнији четботови могу да комуницирају и на нашем језику, квалитет тих одговора је приметно слабији у односу на популарније језике, где свакако има много више доступних података на основу којих модел може да „учи”.
Алекса Гордић, софтверски инжењер који стоји иза овог пројекта, наводи да је YugoGPT по перформансама надмашио LlaMA 2 (Мета AI лабораторија) и Мистрал за српски, босански, хрватски и црногорски језик.
Ово је импресиван резултат, имајући у виду вишемилионски буџет којим располаже Мета. За тренирање једног оваквог језичког модела неопходно је прикупити огромне количине текста, а затим га провући кроз џиновске неуронске мреже које онда покушавају да извуку правилности.
Све ово је временски и финансијски скуп процес, јер је неопходна одговарајућа хардверска инфраструктура.
Простора за напредак има пуно – тек је лансирана прва итерација овог језичког модела, а Гордић наводи како ће већ наредна бити боља од ChatGPT 3.5. Језички модели специјализовани за једну регију имају своје предности, јер генеришу природнији текст који је у складу са духом језика. Такође, располажу богатијим вокабуларом посебно у специфичним нишама.
Well, it's official. YugoGPT 7B significantly beats Mistral and LLaMA 2 and is now officially the best open-source LLM in the world for Serbian & other HBS (Croatian, Bosnian, Montenegrin) languages.
Earlier this summer I was frustrated when I saw how poor the situation is as… pic.twitter.com/L6AGSspjeS
— Aleksa Gordić 🍿🤖 (@gordic_aleksa) December 20, 2023
Алекса Гордић је завршио Електротехнички факултет у Београду 2017. године. Као софтверски инжењер машинског учења има богато искуство – радио је у Мајкрософту и у Дип Мајнду (Гугловој лабораторији за AI). Сада покреће и свој стартуп RunaAI, где ће компанијама нудити персонализоване системе који решавају разне проблеме у области обраде текста, а почетна тачка ће бити управо српски и остали регионални језици.