Communication dans un congrès, Informatique, Traitement du signal et de l'image

Segmentation of TV Shows into Scenes using Speaker Diarization and Speech Recognition

Hervé Bredin. Segmentation of TV Shows into Scenes using Speaker Diarization and Speech Recognition. ICASSP 2012, IEEE International Conference on Acoustics, Speech, and Signal Processing, Mar 2012, Kyoto, Japan. pp.2377-2380, ⟨10.1109/ICASSP.2012.6288393⟩. ⟨hal-01987818⟩

Publié le 24 mai 2022