Keeletehnoloogia laboratoorium

Nimetus
Laboratory of language technology
Head of the research group
Research classification (Frascati)
Keeled ja kirjandus 6.2
Languages and literature 6.2
Overview
Keeletehnoloogia laboratoorium keskendub järgmisetele teemadele:• Kõnetuvastus• Kõneleja, kõneldava keele ja aktsendi identifitseerimine• Kõnekorpused• Foneetika (eesti keele prosoodia, L2 kõne)• Mitmesugused loomuliku keele töötluse alamteemadLabori üheks väljapaistvamaks tegevuseks on eesti keele kõnetuvastuse arendus ning avalikult kättesaadavate kõnetuvastusteenuste loomine. Kuigi labor keskendub arendustöös eesti keelele, on enamik laboris loodud meetodeid ja tehnoloogiaid keelest sõltumatud. Laboris välja töötatud tarkvara on saadaval vaba tarkvara litsentsi alusel.
The Language Technology Laboratory focuseson the following topics:‚ Speech recognition‚ Speaker, spoken language and accentidentification‚ Speech corpora‚ Phonetics (Estonian language prosody andvocal system, L2 speech)‚ Various sub-topics of natural languageprocessingOne of the important activities is the creationof speech technology applications targeted atsociety as a whole. This includes applications ofend-user speech recognition as well as the keyintegration components that are easy to integrate. Although the focus is on speech recognition in Estonian, most of the software createdin the laboratory is not specific to Estonian. Thelaboratory is a solid open source free software supporter.
Research group member
Velve, Andra
Sildam, Tiia
Žavoronkov, Aleksei
Fedorchenko, Artem
Illaste, Erik
Lillepalu, Helena Grete
Doctoral students
Endised liikmed
Keyword
kõnetehnoloogia
speech technology
foneetika
phonetics
kõnekorpused
speech corpora
Important results
2024. aasta tulemused:Koostöös Toulouse’i ja Touloni teadlastega arendati välja meetod PixIT, mis võimaldab ühe mikronigasalvestatud kõnesalvestusest leida erinevatele kõnelejatele kuuluvad kõnesegmendid (speakerdiarizatuon) ning samaaegse kõne puhul ka eraldada iga kõneleja kõnesignaal. Meetodit kirjeldav artikkelsai konverentsil Speaker Odyssey 2024 parima tudengiarrtikli auhinna.Koostöös Toulouse’i ja Touloni teadlastega osaleti konverentsi Interspeech 2024 raames läbiviidudvõistlusel DISPLACE Challenge, mille eesmärk oli mitme aktsendiga kõnelejaga salvestusest leidaerinevatele kõnelejatele kuuluvad kõnesegmendid ning need ka kõneldava keele põhjal klassifitseerida.Meie meeskond sai võistlusel esimese koha.Osalesime konverentsi ICASSP 2025 võistlusel LIMMITS, mis hindas erinevate meeskondade loodudkõnesünteesisüsteeme india keeletele, mis on loodud väheste treeningressurssidega. Meie loodudsüsteem saavutas erinevates kategooriates head tulemused.
Alumäe, T.; Kukk, K.; Le, V.iet-B.; Barras, C.; Messaoudi, A.; Ben Khender, W. (2023). Exploring the impact of pretrained models and web-scraped data for the 2022 NIST Language Recognition Evaluation. INTERSPEECH 2023, 20-24 August 2023, Dublin, Ireland. ISCA, 516−520. DOI: 10.21437/Interspeech.2023-1790