7
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
7
pages
Français
Documents
Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres
Publié par
Langue
Français
Violaine Prince 27/01/09
Grammaires
d’unification
Cours sur le traitement Grammaire catégorielle
Grammaire syntagmatique généraliséeautomatique des langues
(GPSG)(IV)
Les grammaires de tête (comme HPSG)
Grammaire lexicale fonctionnelle (LFG)Violaine Prince
Grammaire d’unification fonctionnelle
Université de Montpellier 2 (FUG)
LIRMM-CNRS
Grammaire à clauses définies (DCG).
Elles peuvent s’exprimer dans le
formalisme PATR-II du Stanford
Research Institute
Les structures deEléments de base traits
Une représentation graphique, avec un
Définition de traits et de valeurs (variable
et domaine de définition). nom de structure
Structure de traits associés aux Type de structure : complexe, atomique
éléments syntaxiques.
Un chemin de traits : suite de traits
Différentes variantes :
permettant de sélectionner une partie
Structure f de LFG
spécifique d’une structure Matrice de traits et catégories de GPSG
Structure fonctionnelle dans FUG Relation entre structures
Terme (DCG)
Directed acyclic graph ou DAG dans
PATR-II
But commun : extension du formalisme
HC
Cours sur le traitement automatique des
langues 1Violaine Prince 27/01/09
Représentation Représentation
graphique graphique
Elle est associée aux structures possédant plus d’un trait Structure récursive intégrant la structure D dans une autre.3sg
(structures complexes). Exemple : représentation d’un SN pronom sujet.
Exemple : Cat : SN
Nombre : Nombre :
singulier singulier nom : D Accord :3sg
Personne : Personne : nom : DSN 3sgtroisième troisième
Cette notation est récursive. Les valeurs de traits peuvent
La structure précédente devenant un trait est nommée être aussi structurées.
comme telle.
Concepts de base Propriétés : la
réentrance
Une structure est dite réentrante si deux traits de cette structure
Les structures complexes comme D3sg ont une valeur en commun.ou D sont des fonctions partiellesSN3sg Représentation graphique, conditions de base :des traits dans l’ensemble des valeurs.
D(f) dénotera la valeur associée au trait f
de la structure D. H: a
D ( nombre) = singulier F: F et G ont deux valeurs égales.3sg K: b
Une structure de traits peut avoir un
domaine vide. Elle est appelée structure H: avide ou variable. G: I: c
Cours sur le traitement automatique des
langues 2Violaine Prince 27/01/09
Représentation de Propriétés : chemin (de
la réentrance traits)
Exemple : la structure D1 SN 3sg
F: H: a F et G on la même valeur. On veut sélectionner la valeur du trait « nombre » de la structure
ee trait associée au trait « accord »
Cat : SN1
G:
Nombre :
Autre représenttion où la notation entre les valeurs communes singulierAccord :
est tracée explicitement.
Personne : nom : DSN 3sgH : aF: troisième
Chemin <Accord Nombre> dans D s’écrit :SN 3sgG :
D (<Accord Nombre>) = singulierSN 3sg
Remarque :
Cat: SN DRelation entre Toute structureSN
vide est subsuméestructures
Cat: SN par toute structure
Une structure comme est atomique. Nombre: non vide.Cat: SN Accord:D singulier DSN SNsg
Entre structures nommées il existe une relation dite de subsomption. DvarCat: SN
Une structure de traits D subsume une structure D’, noté est subsumée par toutesNombre:
D D’ si et seulement si: les autres puisque :singulier
Accord: D ⊆ Dsoit D et D’ sont atomiques et D=D’ var SNPersonne: Dsoit SN3sgtroisièmeD(l) D’(l), l dom (D)
les chemins p et q: D’(p) D’(q)=> D(p) ≡ D(q)
D ⊆ D ⊆DSN SNsg SN3sgOn montrera la subsomption sur l’exemple des structures Subsomption: relation d’ordre
du syntagme nominal SN. Partiel sur l’ensemble des structures.
Cours sur le traitement automatique des
langues 3
≡ ∀
∈ ∀ ⊆
⊆Violaine Prince 27/01/09
L’unification Exemple
Définition formelle: Accord : Nombre :Cat : SN =
Soit deux structures de traits D et D . ∪1 2 Singulier
L’unification de ces structures est définie
par une structure D telle que :3
D ⊆ D1 3
D ⊆ D Cat : SN2 3
Si D ⊆ D et D ⊆ D alors D ⊆ D .1 4 2 4 3 4
Nombre : Si D existe alors D et D sont unifiables.3 1 2 Accord :
Singulier Notation : D = D ∪ D3 1 2
Transformation enpropriétés graphe
L’unification ajoute de l’information.
CatCat:SN Elle est idempotente : Nombre:
1 Si D ⊆ D alors D = D ∪ D singulier1 2 2 1 2 SNAccord :
ν Nature et interprétation graphique Personne accord sujet
:3ème Graphe acyclique :
Arcs étiquetés par des noms de 1
traits Accord:Sujet : personnenombre Valeurs = points terminaux du
graphe. singulier 3ème
Cours sur le traitement automatique des
langues 4Violaine Prince 27/01/09
Règles
combinatoires
La structure de traits définit l’information L’unification se réduit à un
associée aux chaînes.
traitement de graphe.
Les règles combinatoires permettent de
On peut définir d’autres opérations dériver des structures pour représenter
un problème donné.sur les structures de traits :
Une règle PATR-II est définie par : La généralisation
Une partie formelle : une règle de
La disjonction grammaire hors contexte associant des
structures de traits La négation
Une suite de conditions portant sur les
structures de traits associées.
Exemple Forme graphique
Cat : P
Forme :finie1Tête :
X -> X X0 1 2 Nombre:
2
Conditions : singulierSujet : Accord :
XPersonne: <X cat> = P 00
3ème
< X cat> = SN1
< X cat> = SV2
< X tête> = < X tête>0 2
Cat :SN Cat :SV < X tête sujet> = < X tête>0 1 X2X 12 1
Tête : Tête :
Cours sur le traitement automatique des
langues 5Violaine Prince 27/01/09
Simplification desremarques règles
L’application d’une règle se fait en X -> X X0 1 2
accord avec les relations de
<X cat> = P0subsomption.
< X cat> = SN1
Les règles définissent également un
< X cat> = SV2processus d’analyse qui va utiliser le
< X tête> = < X tête>0 2fonctionnement inverse des règles avec
< X tête sujet> = < X tête> devient:des relations d’identité et d’unification. 0 1
Les contraintes d’identité peuvent être P -> SN SV
vues comme des instructions de
< P tête> = < SV tête>
remplacement de sous-structures par
< P tête sujet> = < SN tête>leurs unifications. Cette opération est
appelée unification par abus de langage
(et relation avec l’unification logique).
Des règles de Maisgrammaire du LN
L’information associée aux éléments du Aux précédentes règles on peut
lexique remonte vers la racine de larajouter :
structure syntaxique.
SV -> V
=> il faut au maximum spécifier, au
<SV tête> = <V tête> niveau des structures, les
comportements des éléments.
La grammaire ainsi définie permet
=> sous-catégorisation : représenter lesen fonction des traits de structure
comportements distincts des éléments
D’accepter ‘Jean dort’ d’une même catégorie.
Et de refuser ‘Jean dorment’.
Cours sur le traitement automatique des
langues 6Violaine Prince 27/01/09
La sous-Exemple catégorisation
Le comportement des verbes renverser L’idée est de dire que :
et persuader est distinct.
Chaque verbe a un trait qui
Jean renverse le pot d’Arthur. s’appelle « sous-catégorie » qui va
Jean persuade Arthur de partir. définir une contrainte
Dans un cas : supplémentaire .
SV -> V SN SV -> V SN « renverser »
<SV tête> = <V tête> < SV tête> = < V tête>
Dans l’autre < V souscat = SN>
SV1 -> V SN SV2
Renverser prend un syntagme
<SV1 tête> = <V tête> nominal en sous-catégorie
< SV2 tête forme> = infinitif
La sous-
catégorisation
SV1 -> V SN SV2 « persuader »
< SV1 tête> = < V tête>
<SV2 tête forme> = infinitif
< V souscat = SNINF>
L’objet de « persuader » est un SN
suivi d’un infinitif.
La sous-catégorisation permet de
définir les compléments de verbe.
Cours sur le traitement automatique des
langues 7