Ce projet aborde les problèmes de modélisation liés aux variations d'effort vocal pour le traitement des caractéristiques acoustiques de la voix et de la parole. L'effort est une source majeure de variabilité lors de la production de la parole (Liénard, 1999) mais reste complexe à définir (en fonction de la distance, ou du débit glottique, etc.). L'un de ses principaux produits consiste en une variation de la Force de Voix (FdV), tel que défini par Liénard (2019) : la force de voix correspond au niveau de pression acoustique (SPL, avec pondération C) produit par un locuteur, mesuré en champ libre à un mètre en face du locuteur. La voix résulte d'interactions complexes entre ajustements sous-glottiques, glottiques et supraglottiques ; Titze & Sundberg (1992) ont montré que l'effort nécessaire pour produire une FdV donnée dépend du locuteur et que des ajustements permanents des réglages musculaires sont nécessaires pour produire une qualité vocal particulière, qu'elle soit faible ou forte. Le SPL est malheureusement perdu dans la plupart des enregistrements en raison de chaînes d'enregistrement non calibrées et de microphones inadéquats (Švec, 2018) – cependant les auditeurs savent estimer la FdV d'origine à partir des caractéristiques spectrales. Ce projet vise à produire une estimation de la FdV sur des données de corpus qui n'ont pas été calibrés — typiquement données de média ou de parole spontanée — mais pour lesquels l'effort est une dimension dominante pour expliquer les caractéristiques vocales. Pouvoir disposer d'une estimation robuste de l'intensité de la voix, et la capacité de modifier par des méthodes de synthèse de la parole, les caractéristiques acoustiques liées à la FdV dans un signal donné, serait une étape importante pour progresser dans la compréhension de la parole dans son usage communicatif dans les interactions face-à-face, comme pour les technologies de traitement automatique de la parole.