ANR OntOpiTex - caractérisation d'opinions et de jugements d'évaluation dans les textes

OntOpiTex - Modèles linguistiques et ontologies. Extraction informatique et caractérisation d'opinions et de jugements d'évaluation dans les textes

Coordinateur : Philippe Laublet

Partenaires :

  • Laboratoire Langages, Logique, Informatique, Cognition (LaLIC, Université Paris IV)
  • Groupe de recherche en Informatique, Image, Automatique et Instrumentation de Caen (GREYC, Caen)
  • Centre de Recherches Interlangues sur la Signification et le Contenu (CRISCO, Caen)
  • Société Noopsis (Caen)
  • Société TecKnowMetrix (Grenoble)

Porteur du projet pour le GREYC : Stéphane Ferrari

L'analyse informatisée des opinions, attitudes ou jugements répond à des enjeux économiques et sociaux importants. Pourtant, les travaux actuels se limitent souvent à la notion de polarité (positive, négative, neutre), quand les phénomènes visés sont en réalité bien plus riches, diversifiés et complexes. L'objectif principal d'OntOpiTex est de chercher à identifier et agréger des segments textuels porteurs d'opinions, et surtout de les classer par type (affect, jugement, appréciation, …) et de les caractériser par des critères plus fins : polarité, intensité, prototypicalité, cible(s), source(s), engagement de l'auteur, etc. Des outils interactifs seront proposés pour visualiser et naviguer dans ces annotations à l'échelle d'une collection de documents. Sur le plan scientifique (linguistique, TAL et IC), des questions théoriques importantes émergent concernant la nature même de l'objet « opinion », et le choix des méthodes et outils les plus adaptés à leur traitement. Nous aborderons ces questions sur trois fronts, en adoptant une approche pluridisciplinaire novatrice et originale dans ce champ d'étude : (1) modélisation linguistique et ontologique afin d'éclairer conceptuellement les notions en jeu à l’aide de théories linguistiques comme Appraisal ; (2) développement et mise en oeuvre d'un modèle opératoire pour l'analyse automatique dans les textes ; (3) évaluation et étude de cas d'utilisation, à la fois sur un corpus de travail et dans un cadre applicatif réel. La réalisation de ces objectifs ambitieux sera rendue possible par une étroite collaboration entre laboratoires spécialistes de ces questions, et entreprises dont les métiers allient la veille à l'informatique linguistique.