SEME

SEMantique et Extraction d’information (SEME)

Coordination : Cyril GROUIN

L’équipe SEME (sémantique et extraction d’information) s’intéresse aux problématiques d’accès au sens contenu dans les productions langagières, dans un objectif d’analyse, de compréhension, de modélisation, ou de production. Nous appliquons nos recherches à la modalité écrite, sans restriction sur le support d’origine (texte produit au format électronique, ou provenant d’une transcription de la parole, ou encore d’une reconnaissance optique) et travaillons sur des productions en domaine ouvert ou de spécialité tel que le domaine médical. Nous utilisons des approches aussi bien linguistiques que relevant d’un apprentissage statistique ou neuronal. Précisément sur ce dernier type d’approche, nous nous intéressons au coût environnemental qu’elles génèrent en traitement automatique des langues, tant lors de leur production que lors de leur utilisation.

  • Extraction d’information
  • Corpus et modélisation
  • Sémantique, expressions poly-lexicales

L’équipe se compose de 10 membres permanents (chercheurs CNRS, enseignants-chercheurs à l’Université Paris-Saclay, à l’ENSIIE, et à l’Université Sorbonne Paris-Nord), 14 doctorants, et 3 post-doctorants ou CDD. Nous entretenons des liens avec les industriels (thèses en contrat CIFRE, projets de recherche) et organisons régulièrement des manifestations scientifiques (conférence TALN, ateliers et workshops scientifiques, etc.).

Coordination

  • Sciences et Technologies des Langues

    SEME

    Grouin Cyril

    Ingénieur de recherche HDR

    Responsable de l'équipe SEME

    Co-responsable de la Commission Locaux

Membres de l’équipe

Actualités

Publications

  • Communication dans un congrès

    Laura Spinu, Ioana Vasilescu, Lori Lamel, Jason Lilley. Voicing neutralization in Romanian fricatives across different speech styles. Interspeech, ISCA, Sep 2022, Incheon, South Korea. pp.1342-1346, ⟨10.21437/interspeech.2022-10716⟩. ⟨hal-04465920⟩

    STL, TLP

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Plinio Barbosa, Philippe Boula de Mareüil. Imitating Broadcast News Style: Commonalities and Differences Between French and Brazilian Professionals. Book cover Book cover International Conference on Computational Processing of the Portuguese Language (PROPOR 2018), Sep 2018, Canela, Brazil. pp.419-428, ⟨10.1007/978-3-319-99722-3_42⟩. ⟨hal-04466213⟩

    STL, TLP

    Année de publication

  • Chapitre d'ouvrage

    Philippe Boula de Mareüil, Valentina De Iacovo, Antonio Romano, Frédéric Vernier. Un atlante sonoro delle lingue di Francia e d’Italia: focus sulle parlate liguri. Fiorenzo Toso. Il patrimonio linguistico storico della Liguria. Attualità e futuro, Insedicesimo, pp.33-46, 2019. ⟨hal-04441432⟩

    CPUCognition Perception et Usages, STL, TLP

    Année de publication

  • Article dans une revue

    Yaru Wu, Martine Adda-Decker, Lori Lamel. Schwa Deletion in Word-Initial Syllables of Polysyllabic Words. Journal of Monolingual and Bilingual Speech, 2020, 2 (2), ⟨10.1558/jmbs.17311⟩. ⟨hal-04442984⟩

    STL, TLP

    Année de publication

  • Poster de conférence

    Hélène Bonneau-Maynard. Quelles sont les bonnes pratiques pour que mon cours soit accessible au plus grand nombre ?. journée Initiatives Pédagogiques JIP 2020-2021, Feb 2021, Orsay, France. 2021. ⟨hal-04417697⟩

    STL, TLP

    Année de publication

  • Proceedings/Recueil des communications

    Nicoletta Calzolari, Frédéric Bechet, Philippe Blache, Khalid Choukri, Christopher Cieri, et al.. Proceedings Language Resources and Evaluation Conference (LREC) 2020. Language Resources and Evaluation Conference (LREC) 2020, 2020, 9781713812500. ⟨hal-04415353⟩

    STL, TLP

    Année de publication

    Disponible en libre accès

  • N°spécial de revue/special issue

    Alexandre Allauzen, Hinrich Schütze. Apprentissage profond pour le traitement automatique des langues. Revue TALTraitement Automatique des langues : traitement automatique des langues, 59 (2), 2018. ⟨hal-04421499⟩

    STL, TLP

    Année de publication

    Disponible en libre accès

  • Chapitre d'ouvrage

    Laurence Devillers, Françoise Fogelman-Soulié, Ricardo Baeza-Yates. AI & Human Values. Reflections on Artificial Intelligence for Humanity, 12600, Springer International Publishing, pp.76-89, 2021, Lecture Notes in Computer Science, 978-3-030-69127-1. ⟨10.1007/978-3-030-69128-8_6⟩. ⟨hal-04423272⟩

    STL, TLP

    Année de publication

  • Proceedings/Recueil des communications

    Joseph J Mariani, Gilles Adda, Khalid Choukri, Irmgarda Kasinskaite Buddeberg, Hélène Mazo, et al.. Language Technologies for All (LT4All). Enabling Language Diversity & Multilingualism Worldwide. Language Technologies for All (LT4All), European Language Resources Association, 2020, 979-10-95546-33-7. ⟨hal-04413363⟩

    STL, TLP

    Année de publication

    Disponible en libre accès

  • Poster de conférence

    Hélène Bonneau-Maynard, Thomas Fauvel. Pour un campus numérique accessible. HANDIVERSITÉ 2021, Apr 2021, Orsay, France. ⟨hal-04417061⟩

    STL, TLP

    Année de publication