print

Design choices for PixIT-based speaker-attributed ASR: Team ToTaTo at the NOTSOFAR-1 challenge

autor

Kalda, Joonas

Baroudi, Séverin

Lebourdais, Martin

Pages, Clement

Marxer, Ricard

Alumäe, Tanel

Bredin, Herve

vastutusandmed

Joonas Kalda, Séverin Baroudi, Martin Lebourdais, Clément Pagés, Ricard Marxer, Tanel Alumäe, Hervé Bredin

allikas

Computer Speech & Language

kirjastus/väljaandja

Elsevier

ajakirja aastakäik number kuu

vol. 95

ilmumisaasta

2026

leheküljed

art. 101824, 16 p. : ill

leitav

märksõna

kõnetuvastus

kõne

võtmesõna

Speaker diarization

Speaker-attributed automatic speech

recognition

Speaker embeddings

SSL models

Joint training

ISSN

0885-2308

1095-8363

märkused

Bibliogr. p. 15-16

Open Access

teaduspublikatsioon

klassifikaator

1.1

TTÜ struktuuriüksus

tarkvarateaduse instituut

keel

inglise