Dans le domaine biomédical, les informations cliniques et institutionnelles sont contenues dans le texte de publications scientifiques ou de dossiers patients et ne sont pas directement accessibles à des fins de traitement automatique. Pour pallier cela, des méthodes de Traitement Automatique de Langue Naturelle (TALN) ont été développées avec succès afin d’extraire des informations pertinentes des textes libres et de les convertir en représentations formelles exploitables par l’homme et par la machine. Ce projet propose une analyse qui va au dela de la simple extraction de concepts isolés en permettant d’inclure le contexte d’occurrence ainsi que les relations entre concepts. Par ailleurs, nombre de travaux antérieurs sont limités à l’analyse de textes du domaine biomédical rédigés en anglais. Ce projet participera au nécessaire développement de méthodes permettant d’analyser les dossiers électroniques patient en français afin d’en extraire des représentations formelles compatibles avec celles disponibles pour l’anglais.