Nova rešenja u razvoju softvera zasnovana na sličnosti tekstova

(eng. Advancing Novel Textual Similarity-based Solutions in Software Development)

Program za razvoj projekata
iz oblasti veštačke inteligencije
(finansiran od Fonda za nauku Republike Srbije)

O projektu

Vesti

U ovoj sekciji biće objavljivane najsvežije vesti našeg projektnog tima.

Invitation to participate in the workshop

17.02.2021.

Sa željom da napravimo kratku prezentaciju o ciljevima i planiranim aktivnostima našeg istraživačkog tima na ovom projektu, ali i drugim istraživačkim i razvojnim projektima iz oblasti obrade prirodnih jezika, mašinskog učenja, analize podataka, na kojima radimo na Elektrotehničkom fakultetu u Beogradu, pri Katedri za računarsku tehniku i informatiku, i u okviru Inovacionog centra ETF, organizujemo onlajn radionicu u četvrtak, 25.02.2021. godine u 12:00.

Radionica će se sastojati iz dve sesije:
1) Prezentacija projekta AVANTES i istraživačkog rada iz gorenavedenih oblasti.
2) Okrugli sto, sa diskusijama predstavnika resornih ministarstava, NGO sektora, IT kompanija i akademske zajednice.

Pozivamo sve zainteresovane da se prijave putem sledećeg linka.

Učešće na nacionalnoj konferenciji "Serbian AI Meeting"

31.01.2021.

Članovi AVANTES projektnog tima učestvovali su 18. decembra 2020. godine na nacionalnoj konferenciji "Serbian AI Meeting". Učešće na ovogodišnjoj konferenciji uzelo je više od 100 istraživača iz Srbije i naših istraživača koji rade u inostranstvu, na univerzitetima, naučnim institutima i poznatim razvojnim centrima svetskih kompanija. Tematske oblasti koje su bile obuhvaćene: opšta veštačka inteligencija, formalna logika i rezonovanje, mašinsko učenje i obrada prirodnih jezika. Slajdovi svih predavača se nalaze na sledećem linku. Ceo snimak događaja možete pogledati OVDE.



Kolega Vuk Batanović odbranio doktorsku disertaciju

25.01.2021.

Član našeg AVANTES tima, Vuk Batanović, krajem decembra 2020. godine, odbranio je svoju doktorsku disertaciju na temu "Metodologije rešavanja semantičkih problema u obradi kratkih tekstova napisanih na prirodnim jezicima sa ograničenim resursima" pod mentorstvom prof. dr Boška Nikolića i prof. dr Miloša Cvetanovića.

Čestitamo dr Vuku Batanoviću na predanom radu tokom doktorskih studija, i izrade disertacije, i želimo mnogo uspeha u daljem istraživačkom radu.



Objavljen naučni rad u prestižnom naučnom časopisu PLOS ONE

16.11.2020.

Naučno-istraživački rad pod nazivom "A versatile framework for resource-limited sentiment articulation, annotation, and analysis of short texts" autora Vuka Batanovića, Miloša Cvetanovića i Boška Nikolića, objavljen je u prestižnom naučnom časopisu PLOS ONE. Apstrakt rada i link do samog naučnog rada je moguće pogledati u sekciji Rezultati - Objavljeni radovi.

Virtuelna PSSOH konferencija

27.10.2020.

Članovi našeg projektnog tima, Zaharije Radivojević i Vuk Batanović, učestvovali su na trećoj PSSOH konferenciji, pod nazivom "Primena slobodnog softvera i otvorenog hardvera" u organizaciji Elektrotehničkog fakulteta Univerziteta u Beogradu, na kojoj su predstavili rezultate svog rada, u sklopu projektnih aktivnosti projekta AVANTES.

Otvorena izložba posvećena naučnim projektima iz oblasti veštačke inteligencije

10.10.2020.

Izložba posvećena naučnim projektima iz oblasti veštačke inteligencije, koju je Fond za nauku Republike Srbije organizovao sa Centrom za promociju nauke, otvorena je na Savskom šetalištu na Kalemegdanskoj tvrđavi u petak, 9. oktobra. Svaki naučni projekat prikazan je posterom koji oslikava istraživanje. Članovi projektnog tima AVANTES prisustvovali su otvaranju izložbe i razgovarali sa posetiocima. Izložba je otvorena do 23. oktobra.

Inicijalni sastanak projektnog tima

31.8.2020.

Članovi projektnog tima projekta AVANTES održali su svoj prvi sastanak na kome su podelili svoja zaduženja i zadatke za period od naredna tri meseca.



Projekat AVANTES visoko rangiran

15.8.2020.

U okviru Programa za razvoj projekata iz oblasti veštačke inteligencije, Fond za nauku Republike Srbije finansiraće 12 projekata. Od 70 projektnih predloga, na javnom konkursu zatvorenom 31.1.2020. godine, odabrano je 6 projekata iz osnovnih i 6 iz primenjenih istraživanja. Naš naučni tim i predlog projekta ostvarili su odličan rezultat od 91 poena na konačnoj rang listi projekata i rangirani su na visokom drugom mestu od 12 projekata koji će se finansirati u toku naredne dve godine.



Informacije o projektu

Akronim: AVANTES

Rezultat bliske saradnje istraživača iz naizgled udaljenih naučnih oblasti biće novi sistem koji će olakšati rad softverskim inženjerima, ali i lingvistima koji proučavaju srpski jezik.

Period: sept. 2020 - sept. 2022

Budžet: 198,261.12 €

Interdisciplinarni istraživački tim razviće inteligentni alat za prepoznavanje semantičke sličnosti između delova softverskog sistema ispisanih na programskim jezicima i komentarima na prirodnim jezicima. Posebnu pažnju istraživači će usmeriti na rešavanje problema sličnosti između dva teksta različitih dužina, pre svega na srpskom, uz upoređivanje sa rezultatima dobijenim za engleski jezik. Takođe, realizovani sistem će moći da prepozna duplikate delova softvera. Za potrebe projekta koristiće se novi metodi za analizu programskog koda koji podrazumevaju upotrebu tehnika mašinskog učenja i veštačke inteligencije.

Osim alata za utvrđivanje sličnosti između delova softvera i unesenih komentara, grupa softverskih inženjera i lingvista formiraće i novi algoritam za pretragu koda prema značenju, tačnije putem upita na prirodnom jeziku (srpskom i engleskom).

Projekat AVANTES od velikog je značaja za Srbiju, jer će istraživači formirati skupove anotiranih podataka i uvesti inovacije u postojeće tehnologije za obradu srpskog jezika, za koji je trenutno dostupno daleko manje resursa nego za veće jezike poput engleskog. To će olakšati rad softverskim inženjerima u našoj zemlji, ali i lingvistima koji se bave istraživanjem srpskom jezika.

Članovi tima

Tim je multidisciplinaran i čine ga istraživači sa Elektrotehničkog fakulteta Univerziteta u Beogradu, Filološkog fakulteta Univerziteta u Beogradu i Inovacionog centra Elektrotehničkog fakulteta.



Prof. dr Boško Nikolić

Rukovodilac projekta

Prof. dr Zaharije Radivojević

Član projektnog tima

Doc. dr Dražen Drašković

Član projektnog tima

Dr Vuk Batanović

Član projektnog tima

Vladimir Jocović, master inž. el. i rač.

Član projektnog tima

Tamara Šekularac, master inž. el. i rač.

Član projektnog tima

Marko Mićović, master inž. el. i rač.

Član projektnog tima

Uroš Radenković, master inž. el. i rač.

Član projektnog tima

Jelica Cincović, master inž. el. i rač.

Član projektnog tima

Adrian Milaković, master inž. el. i rač.

Član projektnog tima

Dušan Stojković, master inž. el. i rač.

Član projektnog tima

Aleksa Srbljanović, dipl. el. inž.

Član projektnog tima

Prof. dr Maja Miličević Petrović

Član projektnog tima

Prof. dr Radoslava Trnavac

Član projektnog tima

Doc. dr Tanja Samardžić

Član projektnog tima

Prof. dr Borko Kovačević

Član projektnog tima

Resursi

Ovde će biti prikazani resursi koji će biti objavljeni tokom trajanja projekta.

Objavljeni radovi

U ovoj sekciji biće objavljivani radovi sa konferencija i iz naučnih časopisa.

  • V.Batanović et al., "Open Resources and Technologies for Serbian Language Processing"

    V.Batanović, N.Ljubešić, T. Samardžić, M. Miličević Petrović, "Open Resources and Technologies for Serbian Language Processing", PSSOH conference, Belgrade, Oct. 2020
    Link: https://zenodo.org/record/4113230#.X6GcaohKiUk
    Apstrakt: Otvorenost jezičkih resursa i alata je od velike važnosti za povećanje kvaliteta i brzine razvoja tehnologija za računarsku obradu prirodnih jezika. U ovom radu predstavljeni su otvoreni resursi za obradu srpskog jezika. Opisani su ručno anotirani korpusi, kao i širi spektar alata i računarskih modela, uključujući i veb servis koji omogućava njihovo jednostavno korišćenje.

  • V. Batanović, M.Cvetanović, B.Nikolić, "A versatile framework for resource-limited sentiment articulation, annotation, and analysis of short texts", PLoS ONE 15(11): e0242050. https://doi.org/10.1371/journal.pone.0242050
    Link: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0242050
    Apstrakt:
    Choosing a comprehensive and cost-effective way of articulating and annotating the sentiment of a text is not a trivial task, particularly when dealing with short texts, in which sentiment can be expressed through a wide variety of linguistic and rhetorical phenomena. This problem is especially conspicuous in resource-limited settings and languages, where design options are restricted either in terms of manpower and financial means required to produce appropriate sentiment analysis resources, or in terms of available language tools, or both. In this paper, we present a versatile approach to addressing this issue, based on multiple interpretations of sentiment labels that encode information regarding the polarity, subjectivity, and ambiguity of a text, as well as the presence of sarcasm or a mixture of sentiments. We demonstrate its use on Serbian, a resource-limited language, via the creation of a main sentiment analysis dataset focused on movie comments, and two smaller datasets belonging to the movie and book domains. In addition to measuring the quality of the annotation process, we propose a novel metric to validate its cost-effectiveness. Finally, the practicality of our approach is further validated by training, evaluating, and determining the optimal configurations of several different kinds of machine-learning models on a range of sentiment classification tasks using the produced dataset.

Kontaktirajte nas

Adresa:

Beograd 11000, Bulevar kralja Aleksandra 73

Loading
Vaša poruka je poslata. Hvala!