Design choices for PixIT-based speaker-attributed ASR: Team ToTaTo at the NOTSOFAR-1 challenge
autor
Kalda, Joonas
Baroudi, Séverin
Lebourdais, Martin
Pages, Clement
Marxer, Ricard
Alumäe, Tanel
Bredin, Hervé
vastutusandmed
Joonas Kalda, Séverin Baroudi, Martin Lebourdais, Clément Pagés, Ricard Marxer, Tanel Alumäe, Hervé Bredin
allikas
Computer Speech & Language
kirjastus/väljaandja
Elsevier
ajakirja aastakäik number kuu
vol. 95
ilmumisaasta
2026
leheküljed
art. 101824, 16 p. : ill
leitav
https://doi.org/10.1016/j.csl.2025.101824
märksõna
kõnetuvastus
kõne
võtmesõna
Speaker diarization
Speaker-attributed automatic speech
recognition
Speaker embeddings
SSL models
Joint training
ISSN
0885-2308
1095-8363
märkused
Bibliogr. p. 15-16
Open Access
Open Access
teaduspublikatsioon
teaduspublikatsioon
klassifikaator
1.1
TTÜ struktuuriüksus
tarkvarateaduse instituut
keel
inglise