Kalda, J., Baroudi, S., Lebourdais, M., Pagés, C., Marxer, R., Alumäe, T., Bredin, H.

täiskirje prindi

Design choices for PixIT-based speaker-attributed ASR: Team ToTaTo at the NOTSOFAR-1 challenge

autor

Kalda, Joonas

Baroudi, Séverin

Lebourdais, Martin

Pages, Clement

Marxer, Ricard

Alumäe, Tanel

Bredin, Herve

vastutusandmed

Joonas Kalda, Séverin Baroudi, Martin Lebourdais, Clément Pagés, Ricard Marxer, Tanel Alumäe, Hervé Bredin

allikas

Computer Speech & Language

kirjastus/väljaandja

Elsevier

ajakirja aastakäik number kuu

vol. 95

ilmumisaasta

2026

leheküljed

art. 101824, 16 p. : ill

leitav

https://doi.org/10.1016/j.csl.2025.101824

ISSN

0885-2308

1095-8363

märkused

Bibliogr. p. 15-16

Open Access

teaduspublikatsioon

keel

inglise

Märksõnad ja võtmesõnad

märksõna

kõnetuvastus

kõne

võtmesõna

Speaker diarization

Speaker-attributed automatic speech

recognition

Speaker embeddings

SSL models

Joint training

Teaduspublikatsiooni meetrika

klassifikaator

1.1

TalTechi üksused

TTÜ struktuuriüksus

tarkvarateaduse instituut

Seotud publikatsioonid

Improved Training Methods for Multi-Talker Speech Processing = Treeningmeetodid mitme rääkijaga kõne töötluseks

Kalda, J., Baroudi, S., Lebourdais, M., Pagés, C., Marxer, R., Alumäe, T., Bredin, H. Design choices for PixIT-based speaker-attributed ASR: Team ToTaTo at the NOTSOFAR-1 challenge // Computer Speech & Language (2026) vol. 95, art. 101824, 16 p. : ill. https://doi.org/10.1016/j.csl.2025.101824