Keeletehnoloogia laboratoorium

Klassifikaator (Frascati)
Keeled ja kirjandus 6.2
Uurimisrühma juht
Võtmesõna
kõnetehnoloogia
foneetika
kõnekorpused
Ülevaade
Keeletehnoloogia laboratoorium keskendub järgmisetele teemadele:• Kõnetuvastus• Kõneleja, kõneldava keele ja aktsendi identifitseerimine• Kõnekorpused• Foneetika (eesti keele prosoodia, L2 kõne)• Mitmesugused loomuliku keele töötluse alamteemadLabori üheks väljapaistvamaks tegevuseks on eesti keele kõnetuvastuse arendus ning avalikult kättesaadavate kõnetuvastusteenuste loomine. Kuigi labor keskendub arendustöös eesti keelele, on enamik laboris loodud meetodeid ja tehnoloogiaid keelest sõltumatud. Laboris välja töötatud tarkvara on saadaval vaba tarkvara litsentsi alusel.
Tähtsamad tulemused
2023. aasta tulemused:Uurimisrühma ühisprojekt EMTAga ooperilauljate hääle analüüsil on andnud huvitavaid tulemusi ning artikkel selles ilmus ühes mainekamas akustika-alases ajakirjas Journal of the Acosutic Society of America. Tegemist on maailma mastaabis uudse tööga, sest ooperilaulu arusaadavust pole foneetilise metodoloogiaga varem uuritud.Tanel Alumäe ja Daniil Rõbnikov osalesid konverentsi ASRU 2023 osana peetud võistlusel MADASR Challenge, kus mõõdeti kõnetuvastussüsteemide kvaliteeti kahe Indias kõneldava dialektirikka keele peal. Laboris välja töötatud mudelid andsid parimad tulemused üle kõikide osalenud tiimide. Lahendusest valmis ka artikkel, mis avaldati sama konverentsi kogumikus.
Alumäe, T.; Kalda, J.; Bode, K.; Kaitsa, M. (2023). Automatic closed captioning for Estonian live broadcasts. Proceedings of the 24th Nordic Conference on Computational Linguistics (NoDaLiDa), May 22 - 24, 2023, Tórshavn, Faroe Islands. University of Tartu Library, 492−499. (NEALT Proceedings Series; 52).
Vurma, A.; Meister, E.; Meister, L.; Ross, J.; Raju, M.; Kala, V.; Dede, T. (2023). The intensities of vowels and plosive bursts and their impact on text intelligibility in singing. The Journal of the Acoustical Society of America, 154 (4), 2653−2664. DOI: 10.1121/10.0021968
Alumäe, T.; Kukk, K.; Le, V.iet-B.; Barras, C.; Messaoudi, A.; Ben Khender, W. (2023). Exploring the impact of pretrained models and web-scraped data for the 2022 NIST Language Recognition Evaluation. INTERSPEECH 2023, 20-24 August 2023, Dublin, Ireland. ISCA, 516−520. DOI: 10.21437/Interspeech.2023-1790
Seotud struktuuriüksus