print

Keeletehnoloogia laboratoorium

Nimetus

Laboratory of language technology

Head of the research group

Alumäe, Tanel

Related department

Tarkvarateaduse instituut

Department of software science

TalTech priority area

Usaldusväärsed IT lahendused

Dependable IT solutions

Innovaatilised ettevõtted ja tulevikku vaatav riigivalitsemine

Innovative businesses and future governance

Research classification (Frascati)

Arvutiteadus ja informaatika 1.2

Computer and information sciences 1.2

Keeled ja kirjandus 6.2

Languages and literature 6.2

Overview

Keeletehnoloogia laboratoorium keskendub järgmisetele teemadele:• Kõnetuvastus• Kõneleja, kõneldava keele ja aktsendi identifitseerimine• Kõnekorpused• Foneetika (eesti keele prosoodia, L2 kõne)• Mitmesugused loomuliku keele töötluse alamteemadLabori üheks väljapaistvamaks tegevuseks on eesti keele kõnetuvastuse arendus ning avalikult kättesaadavate kõnetuvastusteenuste loomine. Kuigi labor keskendub arendustöös eesti keelele, on enamik laboris loodud meetodeid ja tehnoloogiaid keelest sõltumatud. Laboris välja töötatud tarkvara on saadaval vaba tarkvara litsentsi alusel.

The Language Technology Laboratory focuseson the following topics: Speech recognition Speaker, spoken language and accentidentification Speech corpora Phonetics (Estonian language prosody andvocal system, L2 speech) Various sub-topics of natural languageprocessingOne of the important activities is the creationof speech technology applications targeted atsociety as a whole. This includes applications ofend-user speech recognition as well as the keyintegration components that are easy to integrate. Although the focus is on speech recognition in Estonian, most of the software createdin the laboratory is not specific to Estonian. Thelaboratory is a solid open source free software supporter.

Related projects

https://www.etis.ee/Portal/Projects/Display/a420f147-a693-4e0e-ad9f-0570862d6a9f

https://www.etis.ee/Portal/Projects/Display/97213ae6-cd28-4f84-84c2-ac61f7658670

https://www.etis.ee/Portal/Projects/Display/5e3c0c11-4317-4843-90f4-2739c538f049

https://www.etis.ee/Portal/Projects/Display/51cb784d-b515-4aae-a1fd-92a4c5cee516

https://www.etis.ee/Portal/Projects/Display/fc546fbf-630b-42fb-be06-e81d0c1d7f10

https://www.etis.ee/Portal/Projects/Display/ddfacad7-df25-42f6-bcc3-69d937741641

Research group member

Meister, Einar

Meister, Lya

Härm, Henry

Rõbnikov, Daniil

Velve, Andra

Sildam, Tiia

Žavoronkov, Aleksei

Fedorchenko, Artem

Illaste, Erik

Lillepalu, Helena Grete

Doctoral students

Kalda, Joonas

Olev, Aivo

Endised liikmed

Kukk, Kunnar

Käver, Andres

Keyword

kõnetehnoloogia

speech technology

foneetika

phonetics

kõnekorpused

speech corpora

Important results

2024. aasta tulemused:Koostöös Toulouse’i ja Touloni teadlastega arendati välja meetod PixIT, mis võimaldab ühe mikronigasalvestatud kõnesalvestusest leida erinevatele kõnelejatele kuuluvad kõnesegmendid (speakerdiarizatuon) ning samaaegse kõne puhul ka eraldada iga kõneleja kõnesignaal. Meetodit kirjeldav artikkelsai konverentsil Speaker Odyssey 2024 parima tudengiarrtikli auhinna.Koostöös Toulouse’i ja Touloni teadlastega osaleti konverentsi Interspeech 2024 raames läbiviidudvõistlusel DISPLACE Challenge, mille eesmärk oli mitme aktsendiga kõnelejaga salvestusest leidaerinevatele kõnelejatele kuuluvad kõnesegmendid ning need ka kõneldava keele põhjal klassifitseerida.Meie meeskond sai võistlusel esimese koha.Osalesime konverentsi ICASSP 2025 võistlusel LIMMITS, mis hindas erinevate meeskondade loodudkõnesünteesisüsteeme india keeletele, mis on loodud väheste treeningressurssidega. Meie loodudsüsteem saavutas erinevates kategooriates head tulemused.

Alumäe, T.; Kukk, K.; Le, V.iet-B.; Barras, C.; Messaoudi, A.; Ben Khender, W. (2023). Exploring the impact of pretrained models and web-scraped data for the 2022 NIST Language Recognition Evaluation. INTERSPEECH 2023, 20-24 August 2023, Dublin, Ireland. ISCA, 516−520. DOI: 10.21437/Interspeech.2023-1790

URL

https://taltech.ee/en/laboratory-language-technology

Publications related to the research group