Thèse

icon

228

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

228

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Thèse
présentée pour l’obtention du titre de
Docteur de l’Université Paris XI
en informatique
par Guillaume Pitel
MICO : La notion de Construction Située pour un Modèle
d’Interprétation et de Traitement de la Référence pour le
Dialogue Finalisé
Soutenue le 17 septembre 2004.
Francis Corblin, Professeur à l’Université Paris IV-Sorbonne, examinateur
Gérard Ligozat, Professeur à l’Université Paris XI,
Laurent Romary, Directeur de Recherche au LORIA-INRIA, rapporteur
Paul Sabatier, Directeur de Recherche au LIF-CNRS, rapporteur
Jean-Paul Sansonnet, Directeur de Recherche au LIMSI-CNRS, directeur de thèse ii Résumé
La question de la résolution de la référence est d’une importance majeure lorsque l’on
souhaites’intéresseràlagénéricitédanslessystèmesdedialogue,cequiestnécessairepour
traiterlesous-casparticulierdesagentsassistantsd’interface.Eneffet,s’ilestrelativement
aisé de résoudre une référence à un objet du contexte lorsque ce dernier est limité à
quelques types d’objets connus, le problème est beaucoup moins trivial si l’on souhaite
pouvoirétendrelagestiondesréférencesàdessituationsmoinscontraintes.Desambiguïtés
pragmatiques peuvent apparaître, des catégories différentes peuvent moins bien «coller»
avec des mots indépendants, ou bien des caractères être communs à plusieurs objets, et
ne plus être discriminants. C’est pour ces différentes raisons que, sans aller jusqu’à traiter
le problème de la référence dans le cadre général du dialogue non contraint, nous avons
cherché à ...
Voir icon arrow

Publié par

Nombre de lectures

136

Langue

Français

Poids de l'ouvrage

4 Mo

Thèse présentée pour l’obtention du titre de Docteur de l’Université Paris XI en informatique par Guillaume Pitel MICO : La notion de Construction Située pour un Modèle d’Interprétation et de Traitement de la Référence pour le Dialogue Finalisé Soutenue le 17 septembre 2004. Francis Corblin, Professeur à l’Université Paris IV-Sorbonne, examinateur Gérard Ligozat, Professeur à l’Université Paris XI, Laurent Romary, Directeur de Recherche au LORIA-INRIA, rapporteur Paul Sabatier, Directeur de Recherche au LIF-CNRS, rapporteur Jean-Paul Sansonnet, Directeur de Recherche au LIMSI-CNRS, directeur de thèse ii Résumé La question de la résolution de la référence est d’une importance majeure lorsque l’on souhaites’intéresseràlagénéricitédanslessystèmesdedialogue,cequiestnécessairepour traiterlesous-casparticulierdesagentsassistantsd’interface.Eneffet,s’ilestrelativement aisé de résoudre une référence à un objet du contexte lorsque ce dernier est limité à quelques types d’objets connus, le problème est beaucoup moins trivial si l’on souhaite pouvoirétendrelagestiondesréférencesàdessituationsmoinscontraintes.Desambiguïtés pragmatiques peuvent apparaître, des catégories différentes peuvent moins bien «coller» avec des mots indépendants, ou bien des caractères être communs à plusieurs objets, et ne plus être discriminants. C’est pour ces différentes raisons que, sans aller jusqu’à traiter le problème de la référence dans le cadre général du dialogue non contraint, nous avons cherché à donner un cadre de résolution de la référence dans le cas des agents assistants d’interface. Nous avons constaté les nombreux parallèles entre les systèmes de production de Ne- well, dont on sait qu’ils permettent de modéliser une partie des processus cognitifs, et les constructions de Fillmore, qui permettent de décrire les relations entre formes syn- taxiques et représentations sémantiques. Cependant, il manque à ces notions la capacité de traiter des structures ayant des caractéristiques topologiques complexes, comme les représentations servant à un raisonnement temporel, qui sont pourtant nécessaires dans de nombreux modèles de raisonnement. Le modèle d’interprétation constructionnelle (MIC) que nous avons conçu est un mo- dèle d’interprétation pour le dialogue finalisé, où les différentes entrées du système de dialogue, qu’elles soient textuelles, visuelles ou autre sont traitées de manière homogène au moyen d’une opération unique : less-constructions, une forme évoluée des construc- tions issues de la grammaire de construction de Fillmore. Nous avons introduit la notion de s-construction (aussi appelée construction située) afin de pouvoir prendre en compte le fait que l’information traitée par le système de dia- logue (décrite par des schémas issus de la sémantique des frames) peut être organisée à un niveau supérieur, y compris dans des structures dotées d’une topologie. La topologie qui organise les informations que contiennent ces structures peut être modélisée par des logiques particulières, qui permettent de décrire un système de contraintes. Par exemple, la logique de Allenpour la modélisation temporelle des événements peut être utilisée pour structurer les schémas représentant les événements. Les relations ainsi décrites peuvent être utilisées ensuite pour résoudre certaines références temporelles : l’expression «avant cela » désignant le segment temporel précédant l’événement désigné par « cela ». Ainsi, dans les s-constructions, les contraintes sur l’organisation de l’information (i.e. sur les conteneurs) peuvent être décrites tout autant que les contraintes sur le contenu de l’infor- mation. Dans notre modèle, l’interface permettant de décrire la logique qui supporte les caractéristiques topologiques d’un certain conteneur est nomméecontexte, le modèle lo- gique proprement dit n’est pas décrit dans le modèle, mais laissé à la charge d’un système externe. La mise en œuvre du modèle d’interprétation constructionnelle, MICO, est inspirée par les travaux de Bryant sur l’implémentation d’une grammaire de construction grâce à une méthode d’analyse par tronçon (chunk parsing) et des travaux de Engel sur l’analyse linguistique par systèmes de production utilisée dans le projet SmartKom. Pour cette implémentation, nous introduisons la notion d’observateur, qui est l’équivalent opéra- tionnel des s-constructions. Un observateur est capable de reconnaître certaines formes dans les environnements (équivalent opérationnel des contextes) et peut produire une nouvelle information dans un environnement si cette forme est reconnue. La faisabilité d’une interprétation basée sur ce modèle n’est pas évidente, car la gram- maire décrite par les s-constructions est une grammaire contextuelle, et donc indécidable. Afin de rendre l’exécution des observateurs possible, nous adjoignons deux mécanismes iii pour guider le parcours du graphe d’interprétation. Le premier mécanisme utilise une information de pondération sur la probabilité de déclenchement a priori permettant d’or- donnancerplusefficacementl’exécutiondesobservateurs.Cettepondérationpeutêtresoit calculéemanuellement,soitdéterminéeautomatiquementgrâceàunalgorithmed’appren- tissage.Lesecondmécanismeestunegénéralisationduprincipederestrictiondesélection, généralisation rendue possible du fait que les informations manipulées dans notre modèle sont structurées. L’idée est d’augmenter la probabilité de déclenchement des observateurs capables de produire l’information attendue par un certain observateur, qui ne dispose que d’une partie de son motif de déclenchement. Le fait que les informations soient struc- turéestopologiquementetdansdescontextesdistinctspermetdespécifierqu’unecertaine information est attendue dans une certaine zone (une zone étant l’ensemble des lieux qui respectent certaines contraintes, relativement à un contexte donné), et donc de décider assez rapidement si un observateur particulier a des chances de produire l’information attendue à l’endroit prévu. Ce mécanisme permet aussi de décrire la coercition à la de- mande, en spécifiant qu’un observateur ne peut être déclenché que si sa production est attendue. Enfin, en couplant ce mécanisme avec une approche de satisfaction partielle de contraintes pour décrire les motifs de déclenchement des observateurs, on assure au système d’interprétation une certaine robustesse. Afin de montrer que le modèle d’interprétation constructionnelle peut être utilisé pour traiter des phénomènes complexes, nous avons conçu un modèle de résolution extension- nelle de la référence capable de traiter des prédicats vagues, et qui utilise un version continue des domaines de référence (Corblin, Reboul). Dans ce cadre, nous soulevons plu- sieurs questions sur la pertinence de l’utilisation d’une représentation propositionnelle des entités pour l’analyse linguistique. Nous montrons que la prise en compte du contexte dans l’analyse des expressions référentielles induit l’existence de plusieurs interprétations possibles pour un même prédicat référentiel appliqué à un même type d’objet. Nous pro- posons qu’une représentation possible d’un des rôles de prédicat puisse être basée sur des fonctions agissant dans des domaines de références. Ayant constaté l’adéquation de ce modèle aux besoins des systèmes d’interprétation des agents conversationnels, nous montrons comment l’adapter au modèle d’interprétation unifié que nous avons conçu. iv Abstract We have designed the MICO model (Observer-based Constructional Interpretation Model) in order to provide an answer to certain needs of pratical dialogue systems, such as genericity and adequacy with cognitive theories, which have to be fulfilled in order to produce evolutive and expressive dialogue systems. The constructional interpretation mo- del provides a homogeneous way to describe treatments of different inputs of the dialogue system, such as textual, visual or other kinds of inputs. The system is based on a single kind of operation : s-constructions (situated construc- tions), an advanced version of Fillmores constructions. S-constructions offer the ability to describe the way information such as temporal of visual information can be processed. In MICO,thestructurescontainingtheinformationarecalledcontexts.Theimplementation of the contexts is let to an external part, the model only helps to describe the interface of the structure, through relations and operations on the locations of the structure. We introduced the notion of observer for the implementation of the model. Observers are the computational counterpart of s-constructions, and are able to recognize patterns incontext, thento produce new information.In order tomake the modelcomputationally tractable, we also propose to combine several mechanisms for execution control. AsanillustrationofMICOexpressiveness,weconceivedaconcretereferenceresolution model handling vague predicates and using a continuous version of domains of reference (Corblin, Reboul). We propose a representation for one of the possible roles of referential predicates, based on several functions acting on domains of reference, and we adapt it to the constructional interpretation model. v vi Sommaire Sommaire vii Table des figures xi Liste des tableaux xv Introduction 1 I Architecture d’interprétation pour les systèmes de dialogue finalisé 5 1 Interaction Homme-Machine Naturelle 7 1.1 Motivation pour les interfaces naturelles . . . . . . . . . . . . . . . . . . . . . 7 1.2 Interfaces naturelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3 Agents assistants d’interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 Modèles d’interprétation 27 2.1 Théories linguistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.2 Architectures Modulaires versus Unifiées . . . . . . . . . . . . . . . . . . . . . 33 2.3 Topologies et Espaces pour la langue et la cognition . . . . . . . . . . . . . . 42 3 Considérations théoriques sur le rôle des représentations dans l’in
Voir icon more
Alternate Text