VEŠTAČKA INTELIGENCIJA PROGOVORILA SRPSKI A EVO I KAKO Upoznajte YugoGPT, domaćeg AI četbota koji je nadmašio Zakerbergovog
Stigao je i YugoGPT - prvi AI jezički model za balkansko govorno područje, a već u prvoj verziji je uspeo da nadmaši Metin LlaMA 2.
YugoGPT je lansiran 25. decembra, a za prvih 24 sata je prikupio 1.250 registrovanih korisnika. Ima veoma sličan interfejs kao i ChatGPT, s tim što iza njega stoji jezički model treniran specifično na srpskim, bosanskim, crnogorskim i hrvatskim podacima.
Iako najpopularniji četbotovi mogu da komuniciraju i na našem jeziku, kvalitet tih odgovora je primetno slabiji u odnosu na popularnije jezike, gde svakako ima mnogo više dostupnih podataka na osnovu kojih model može da „uči”.
Aleksa Gordić, softverski inženjer koji stoji iza ovog projekta, navodi da je YugoGPT po performansama nadmašio LlaMA 2 (Meta AI laboratorija) i Mistral za srpski, bosanski, hrvatski i crnogorski jezik.
Ovo je impresivan rezultat, imajući u vidu višemilionski budžet kojim raspolaže Meta. Za treniranje jednog ovakvog jezičkog modela neophodno je prikupiti ogromne količine teksta, a zatim ga provući kroz džinovske neuronske mreže koje onda pokušavaju da izvuku pravilnosti.
Sve ovo je vremenski i finansijski skup proces, jer je neophodna odgovarajuća hardverska infrastruktura.
Prostora za napredak ima puno – tek je lansirana prva iteracija ovog jezičkog modela, a Gordić navodi kako će već naredna biti bolja od ChatGPT 3.5. Jezički modeli specijalizovani za jednu regiju imaju svoje prednosti, jer generišu prirodniji tekst koji je u skladu sa duhom jezika. Takođe, raspolažu bogatijim vokabularom posebno u specifičnim nišama.
Well, it's official. YugoGPT 7B significantly beats Mistral and LLaMA 2 and is now officially the best open-source LLM in the world for Serbian & other HBS (Croatian, Bosnian, Montenegrin) languages.
Earlier this summer I was frustrated when I saw how poor the situation is as… pic.twitter.com/L6AGSspjeS
— Aleksa Gordić ?? (@gordic_aleksa) December 20, 2023
Aleksa Gordić je završio Elektrotehnički fakultet u Beogradu 2017. godine. Kao softverski inženjer mašinskog učenja ima bogato iskustvo – radio je u Majkrosoftu i u Dip Majndu (Guglovoj laboratoriji za AI). Sada pokreće i svoj startup RunaAI, gde će kompanijama nuditi personalizovane sisteme koji rešavaju razne probleme u oblasti obrade teksta, a početna tačka će biti upravo srpski i ostali regionalni jezici.