Isaac-These-Finale

icon

238

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

238

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

´Universit´e Paris IV – Sorbonne Ecole doctorale Concepts et Langages
`THESE
pour l’obtention du grade de
DOCTEUR DE L’UNIVERSITE PARIS IV – SORBONNE
Discipline : Informatique
pr´esent´ee et soutenue publiquement le 8 d´ecembre 2005
par
Antoine Isaac
Conception et utilisation d’ontologies
pour l’indexation de documents
audiovisuels
Devant le jury compos´e de :
Rapporteurs : Mme Sylvie Lain´e-Cruzel
Mr Gilles Kassel
Examinateur : Mme Arlette Boulogne
Encadrant INA : Mr Bruno Bachimont
Co-directeur de thèse LaLICC : Mr Philippe Laublet
Directeur de thèse : Mr Jean-Pierre Descl´es
Laboratoire Langages, Logiques, Informatique, Cognition, Communication, UMR CNRS 8139
Institut National de l’Audiovisuel Mis en page avec la classe thloria. Remerciements
Mesremerciementsvonttoutd’abordauxdeuxpersonnesquiontassurél’encadrement«quo-
tidien » de cette thèse : Bruno Bachimont et Philippe Laublet. En plus de remplir brillamment
leur fonction de pourvoyeurs d’idées, de relecteurs rigoureux, ils ont su encourager un doctorant
– parfois sceptique – à aller jusqu’au bout de son effort de recherche, ce qui n’est pas rien.
Je remercie également mon directeur de thèse, Jean-Pierre Desclés, pour son ouverture d’es-
prit. Il m’a en effet permis de suivre des pistes qui s’écartaient des théories qu’il s’attache à
défendre habituellement.
Merci ensuite à Gilles Kassel, qui a accepté de présider le jury de cette thèse. Je tiens à
signaler que l’intérêt qu’il a bien voulu accorder à mes travaux, ...
Voir icon arrow

Publié par

Nombre de lectures

107

Langue

Français

Poids de l'ouvrage

6 Mo

´Universit´e Paris IV – Sorbonne Ecole doctorale Concepts et Langages `THESE pour l’obtention du grade de DOCTEUR DE L’UNIVERSITE PARIS IV – SORBONNE Discipline : Informatique pr´esent´ee et soutenue publiquement le 8 d´ecembre 2005 par Antoine Isaac Conception et utilisation d’ontologies pour l’indexation de documents audiovisuels Devant le jury compos´e de : Rapporteurs : Mme Sylvie Lain´e-Cruzel Mr Gilles Kassel Examinateur : Mme Arlette Boulogne Encadrant INA : Mr Bruno Bachimont Co-directeur de thèse LaLICC : Mr Philippe Laublet Directeur de thèse : Mr Jean-Pierre Descl´es Laboratoire Langages, Logiques, Informatique, Cognition, Communication, UMR CNRS 8139 Institut National de l’Audiovisuel Mis en page avec la classe thloria. Remerciements Mesremerciementsvonttoutd’abordauxdeuxpersonnesquiontassurél’encadrement«quo- tidien » de cette thèse : Bruno Bachimont et Philippe Laublet. En plus de remplir brillamment leur fonction de pourvoyeurs d’idées, de relecteurs rigoureux, ils ont su encourager un doctorant – parfois sceptique – à aller jusqu’au bout de son effort de recherche, ce qui n’est pas rien. Je remercie également mon directeur de thèse, Jean-Pierre Desclés, pour son ouverture d’es- prit. Il m’a en effet permis de suivre des pistes qui s’écartaient des théories qu’il s’attache à défendre habituellement. Merci ensuite à Gilles Kassel, qui a accepté de présider le jury de cette thèse. Je tiens à signaler que l’intérêt qu’il a bien voulu accorder à mes travaux, avant même l’étape du rapport, a été pour moi une grande source de motivation. Je remercie aussi Sylvie Lainé-Cruzel et Arlette Boulogne. Leur participation à mon jury a été l’occasion pour moi de confronter mes positions à celles d’expertes avisées en sciences de l’information et de la documentation, confrontation que j’estime tout à fait enrichissante. Mes pensées vont également à l’ensemble des participants du projet Opales, avec qui j’ai découvert ce que faire de la recherche appliquée voulait dire. Avec une mention toute particulière pour l’équipe « locale » de l’INA : Véronique, Fabrice et Patrick. Des remerciements honnêtes ne peuvent ignorer le rôle fondamental joué dans le déroulement de cette thèse par la Direction de la Recherche de l’INA, dont je tiens à remercier l’ensemble des membres, et en particulier ceux des équipes Métadonnées et dca dont l’activité a rythmé mon passage à l’Institut. Pour les amateurs, voici venu le temps de remerciements moins institutionnels, avec leurs brochettes de prénoms. AuLalicc, je pense tout particulièrement à l’équipe de la Cuisine, et en particulier à Marie, Aude, Carine, Motasem et Jorge. Les thés et petits gâteaux ont contribué à rendre mes visites là-bas extrêmement plaisantes. A l’ina, mes pensées vont vers ceux qui ont partagé avec moi pauses café et repas, sur aire d’autoroute ou en tente, et aussi bien avant, pendant ou après ce qu’il sera convenu d’appeler l’Aged’Or,dontlesancienssesouviennentleslarmesauxyeux:Jérôme,Estelle,Younès,Yohann Le Mortier, Thomas, Rémi, Jean-Calude, Matthieu, Fabienne, JPP, Benedetta, Steffen, Claude, Yann. Avec une attention spéciale pour Véronique et Raphaël, pour tout ce qui a été partagé dans le bureau des ontologues, mais aussi au dehors. Au-delà,nombreuxsontévidemmentceuxquejepourraissaluer,qu’ilssoientdeParis,Rouen ou Dieppe – et oui. Amis, famille, ceux d’entre eux qui auraient ce manuscrit dans les mains pourront se reconnaître. Le lecteur extérieur ne trouvera pas ici de témoignage de gratitude envers un quelconque dieu, sauf peut-être une allusion bien mystérieuse à l’esprit du Lama Dominant à qui j’espère rester fidèle. Il ne trouvera pas non plus d’autres prénoms, excepté évidemment celui de Cécile, à qui je dois désormais tant. i ii Table des matières Introduction 1 1 L’INA, endroit rêvé pour effectuer une thèse CIFRE? . . . . . . . . . . . . . 1 2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 Déroulement de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.1 Cheminement de notre recherche . . . . . . . . . . . . . . . . . . . . . 4 3.2 Retour sur ce qui a été fait dans la thèse et plan du manuscrit . . . . 6 Partie I Introduire les ontologies dans le processus d’indexation 1 La description des documents audiovisuels dans les processus documen- taires 11 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.1 Le statut documentaire du document audiovisuel . . . . . . . . . . . . 11 1.1.2 La problématique de la description du contenu . . . . . . . . . . . . . 12 1.2 Le problème de l’accès à l’information pour les documents audiovisuels. . . . 13 1.2.1 La nécessaire interprétation des documents audiovisuels . . . . . . . . 13 1.2.2 La description linguistique comme substitut documentaire . . . . . . . 15 1.2.3 Améliorer la qualité de l’indexation dans son contexte de production et d’usage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.3 Le contrôle du support de l’indexation . . . . . . . . . . . . . . . . . . . . . . 22 1.3.1 Index, recherche et variabilité textuelle . . . . . . . . . . . . . . . . . 22 1.3.2 Contrôler le vocabulaire des index . . . . . . . . . . . . . . . . . . . . 24 1.3.3 Structurer les index . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 iii Table des matières 2 Ontologies et SBC pour la description conceptuelle de documents AV 37 2.1 Introduction : représenter au niveau de la connaissance pour indexer . . . . . 37 2.2 IC et expressivité descriptive . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.2.1 IA et langages structurés . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.2.2 Vocabulaire de représentation et ontologies . . . . . . . . . . . . . . . 46 2.3 Ontologies, contrôle et traitements pour des systèmes d’indexation et de re- cherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3.1 Spécifications ontologiques et respect de la continuité sémantique . . . 50 2.3.2 Inférence, continuité sémantique et pertinence d’un sbc . . . . . . . . 62 2.4 Utilisations concrètes d’ontologies par des systèmes de recherche d’information 66 2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Partie II Prendre en compte l’usage dans l’implémentation de solutions d’in- dexation ontologique 3 Faciliter la conception et l’accès aux index sémantiques 77 3.1 Introduction : vers une prise en compte des usages dans les solutions existantes 77 3.2 Aider la compréhension de la substance des descriptions . . . . . . . . . . . . 79 3.2.1 Le nécessaire ancrage dans les compréhensions et usages du domaine . 79 3.2.2 Des notions ontologiques normalisées . . . . . . . . . . . . . . . . . . 86 3.3 Assister la formulation des descriptions . . . . . . . . . . . . . . . . . . . . . 91 3.3.1 Prescrire le contenu des index . . . . . . . . . . . . . . . . . . . . . . 92 3.3.2 Patrons d’indexation . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.3.3 Utilisation des patrons d’indexation et raisonnement . . . . . . . . . . 106 3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4 Faciliter la conception d’ontologies pour l’indexation sémantique 111 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.2 Des propositions pour rationaliser la conception des ontologies . . . . . . . . 113 4.2.1 Desméthodologiespourorganiserlecylededéveloppementdesontologies115 4.2.2 Des principes pour rendre la conception cohérente . . . . . . . . . . . 118 4.2.3 Initier le processus de conception des ontologies . . . . . . . . . . . . 122 iv 4.3 Prescrire une manière de construire les notions ontologiques . . . . . . . . . . 123 4.3.1 archonte, un processus de conception d’ontologies régionales . . . . 124 4.3.2 Des outils pour faciliter la saisie des spécifications formelles . . . . . . 128 4.3.3 DOE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 4.4 Ingénierie ontologique et patrons d’indexation. . . . . . . . . . . . . . . . . . 136 4.4.1 Ingénierie ontologique et patrons de conception . . . . . . . . . . . . . 137 4.4.2 Patrons de conception de haut niveau et besoins applicatifs . . . . . . 143 4.4.3 Vers une solution articulant patrons de conception et patrons d’utili- sation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 4.4.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 5 Expérimentations et discussions 155 5.1 Récapitulatif des apports méthodologiques de cette thèse . . . . . . . . . . . 155 5.2 Expérimentations ontologiques . . . . . . . . . . . . . . . . . . . . . . . . . . 158 5.2.1 Cyclisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 5.2.2 Opales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 5.2.3 Expérimentation « chirurgie cardiaque » . . . . . . . . . . . . . . . . 168 5.2.4 Expérimentation eon . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 5.2.5 Récapitulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 5.3 Discussions méthodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 5.3.1 Utilisation d’ontologies pour indexer des vidéos . . . . . . . . . . . . . 186 5.3.2 Faciliter la conception des ontologies . . . . . . . . . . . . . . . . . . . 191 5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 Conclusion 201 Bibliographie 207 v Table des matières vi Table des figures 1.1 Exemples de requêtes adressées au Département des Archives de l’INA . . . . . . 13 1.2 Une séquence à la signification obscure . . . . . . . . . . . . . . . . . . . .
Voir icon more
Alternate Text