2024. aasta tulemused:Koostöös Toulouse’i ja Touloni teadlastega arendati välja meetod PixIT, mis võimaldab ühe mikronigasalvestatud kõnesalvestusest leida erinevatele kõnelejatele kuuluvad kõnesegmendid (speakerdiarizatuon) ning samaaegse kõne puhul ka eraldada iga kõneleja kõnesignaal. Meetodit kirjeldav artikkelsai konverentsil Speaker Odyssey 2024 parima tudengiarrtikli auhinna.Koostöös Toulouse’i ja Touloni teadlastega osaleti konverentsi Interspeech 2024 raames läbiviidudvõistlusel DISPLACE Challenge, mille eesmärk oli mitme aktsendiga kõnelejaga salvestusest leidaerinevatele kõnelejatele kuuluvad kõnesegmendid ning need ka kõneldava keele põhjal klassifitseerida.Meie meeskond sai võistlusel esimese koha.Osalesime konverentsi ICASSP 2025 võistlusel LIMMITS, mis hindas erinevate meeskondade loodudkõnesünteesisüsteeme india keeletele, mis on loodud väheste treeningressurssidega. Meie loodudsüsteem saavutas erinevates kategooriates head tulemused.
Alumäe, T.; Kukk, K.; Le, V.iet-B.; Barras, C.; Messaoudi, A.; Ben Khender, W. (2023). Exploring the impact of pretrained models and web-scraped data for the 2022 NIST Language Recognition Evaluation. INTERSPEECH 2023, 20-24 August 2023, Dublin, Ireland. ISCA, 516−520. DOI: 10.21437/Interspeech.2023-1790