Du

Horaire -

Lieu LISN Site Belvédère

Séminaires Sciences et technologies des Langues

La détection d’opinion et la mesure de sa fiabilité

IPSA, École d’ingénieurs Aéronautique et Spatiale Paris

Orateur : Faiza Belbachir

La présence d’information de nature subjective (opinion) apparaît de manière très visible sur différentes plate-formes. Ces opinions ont une grande importance dans plusieurs domaines (politique, commercial, ou industriel) . Elles jouent un rôle essentiel dans la prise de décision des internautes. Une opinion non fiable peut mener à des décisions désastreuses. De ce fait, déterminer l’opinion fiable est d’une importance primordiale.

Mes travaux de recherche portent sur cette problématique. La première tâche est de pouvoir modéliser et déterminer l’opinion dans un document. Pour ce faire, nous proposons une approche lexicale afin de déterminer les documents porteurs d’opinion. Nous exploitons différentes ressources subjectives, ouvertes, disponibles telles que IMDb, ROTTEN, CHESLY et MPQA qui constituent la source d’opinions. Nous supposons que si un document est similaire à cette source, il est vraisemblablement porteur d’opinions. Pour estimer cette vraisemblance, nous proposons de modéliser le document à tester et la source d’opinion par des modèles de langue (des modèles probabilistes) et de mesurer la similarité des deux modèles. Plus cette similarité est grande et plus le document est vraisemblablement subjectif. 

La deuxième tâche est de pouvoir déterminer les documents porteurs d’opinions fiables. A cet effet, nous introduisons le concept de score de confiance qui mesure la fiabilité de l’opinion du document par rapport au sujet en question. Le calcul de ce score se base sur différentes informations telles que le nombre de commentaires postés, le nombre de commentaires utiles et d’autres informations liées au commentaire et à l’utilisateur. Ce score de confiance est combiné au score d’opinion pour l’obtention d’un score final permettant de retourner les documents porteurs d’opinions fiables.

Lieu de l'événement