Introduction

icon

26

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

26

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Chapitre 1
Introduction
Cette thèse est consacrée à la représentation de la géométrie des images. Pour obtenir une
représentationefficaceilfautmodéliserl’informationgéométriqueetonconstruitdesoutils
pourtraitercemodèle.Cesdeuxingrédientsvontdepaire,s’influençantmutuellementpour
obtenir un résultat satisfaisant, c’est à dire un modèle pertinent et des algorithmes rapides
et performants.
On propose donc une modélisation géométrique des images, l’ambition étant de pouvoir
extraire l’information contenue dans les images naturelles, c’est-à-dire les images qui nous
entourent. Ce problème est bien sûr difficile car la géométrie des images est complexe et
variable.
(a) (b) (c)
(d) (e) (f)
Fig. 1.1 Exemples d’images et de textures.
Textur
es
Image
s 2 Chapitre 1 Introduction 1.1
1.1 La géométrie des images
La géométrie des images et des textures. La figure 1.1 (a–c) fournit des exemples
d’images géométriques de complexité croissante.
L’image 1.1 (a) montre une image géométrique simple. Il s’agit d’un objet géométrique de
couleur uniforme sur un fond uniforme. Malgré la simplicité de cet exemple, la description
de cette forme nécessite de nombreux détails : ce triangle possède des coins, ses côtés sont
légèrement courbés et ces derniers sont un peu flous.
En agrégeant de nombreux objets géométriques, on arrive à une image proche de celle des
dessins animés, comme on peut le voir à la figure 1.1 (b). Les phénomènes d’occlusion
entre les différents plans de la scène complexifient encore la ...
Voir icon arrow

Publié par

Nombre de lectures

110

Langue

Français

Poids de l'ouvrage

2 Mo

Chapitre 1 Introduction Cette thèse est consacrée à la représentation de la géométrie des images. Pour obtenir une représentationefficaceilfautmodéliserl’informationgéométriqueetonconstruitdesoutils pourtraitercemodèle.Cesdeuxingrédientsvontdepaire,s’influençantmutuellementpour obtenir un résultat satisfaisant, c’est à dire un modèle pertinent et des algorithmes rapides et performants. On propose donc une modélisation géométrique des images, l’ambition étant de pouvoir extraire l’information contenue dans les images naturelles, c’est-à-dire les images qui nous entourent. Ce problème est bien sûr difficile car la géométrie des images est complexe et variable. (a) (b) (c) (d) (e) (f) Fig. 1.1 Exemples d’images et de textures. Textur es Image s 2 Chapitre 1 Introduction 1.1 1.1 La géométrie des images La géométrie des images et des textures. La figure 1.1 (a–c) fournit des exemples d’images géométriques de complexité croissante. L’image 1.1 (a) montre une image géométrique simple. Il s’agit d’un objet géométrique de couleur uniforme sur un fond uniforme. Malgré la simplicité de cet exemple, la description de cette forme nécessite de nombreux détails : ce triangle possède des coins, ses côtés sont légèrement courbés et ces derniers sont un peu flous. En agrégeant de nombreux objets géométriques, on arrive à une image proche de celle des dessins animés, comme on peut le voir à la figure 1.1 (b). Les phénomènes d’occlusion entre les différents plans de la scène complexifient encore la structure de l’image. Ce type d’images constitue le premier modèle qui sera abordé dans cette thèse. La photographie 1.1 (c) est représentative des images que l’on souhaite pouvoir traiter car le monde qui nous entoure n’est pas celui des dessins animés. Elle possède certes des objets géométriques mais une grande part de l’information est contenue dans les textures qui remplissent ces objets. Les images (d-f) montrent des textures possédant une structure géométrique. Ce sont ces textures géométriques qui font défaut au modèle d’images régulières par morceaux (images (a–b)). Pourtant, ces textures sont présentes dans la plupart des photographies que l’on souhaite comprimer. Une caractéristique commune de ces textures est qu’elles sont formées par de longs filaments qui s’entrechoquent (couches sismiques (d), nervures du bois (e) et fluide turbulent (f)). Le deuxième modèle abordé dans cette thèse est celui des textures turbulentes, qui possèdent des structures géométriques longues. Formationdelagéométrie. Cettemultitudedestructuresgéométriquespeutenpartie s’expliquer par le principe de formation de ces images. Une scène photographiée est composée d’objets se cachant les uns les autres et projetant desombres. Le principed’occlusioncréedes contourset des jonctions,de plus la diffraction de la lumière a tendance à lisser ces courbes. Ce type de phénomènes justifie en partie le modèle de dessin animé représenté à l’image 1.1 (b). De nombreux phénomènes naturels créent des textures géométriques, comme par exemple des écoulements turbulents (image 1.1 (f)) ou bien des croissances régulières (images 1.1 (e)). Enfin, les constructions humaines possèdent souvent des structures périodiques et symé- triques, comme par exemple les stries et damiers des habits dans l’image 1.1 (c). Traitement de la géométrie. La compréhension de la géométrie des images constitue le point bloquant dans nombre d’applications. En traitement d’images, la compression, le débruitage et l’inversion d’opérateurs sont bien sûr concernés et sont abordés dans cette thèse. En vision par ordinateur, les problèmes de groupage et de segmentation mettent en jeudesformesgéométriquesetlaquestiondelareconnaissancedeformessedoitd’exploiter des a priori géométriques. Enfin, en graphisme 2D et 3D, la synthèse d’images et particu- lièrement de textures demande un réalisme accru et donc une grande fidélité géométrique. 1.1.1 La géométrie des images 3 Uneapprochecourantepouranalyseruneimageestdetrouverunereprésentationcompacte de son contenu. Pour obtenir une représentation efficace, il faut exploiter les sources de régularité qui existent dans l’image. Les outils classiques comme l’analyse de Fourier et l’analyse en ondelettes doivent être dépassés pour analyser la régularité géométrique des images naturelles. La recherche de représentations non redondantes est à la base du développement de la théorie de l’information fondée par Shannon [172] et de la physiologie de la vision, comme postulé par Attneave [12]. La théorie de l’information a eu un impact considérable sur l’analyse d’images, mais ce n’est qu’assez récemment que les outils numériques ont été rapprochés des modèles physiologiques, voir par exemple les travaux de Olshausen et Field [143]. La recherche d’outils mathématiques pour représenter la géométrie pourrait ainsi avoir un impact sur la compréhension du fonctionnement du cortex visuel. 1.1.1 Modèle mathématique Le premier type de structures géométriques étudié dans cette thèse est celui des images de dessins animés, figure 1.1 (b). On peut les définir mathématiquement comme des fonctions régulières à l’extérieur d’un ensemble de courbes régulières. Comme les images naturelles ontrarementdesdiscontinuitésaussifranches,unlissagepeutaussiêtreappliquéàl’image, avec un noyau a priori inconnu. Ce modèle a été introduit par Donoho dans [67] et il a aussi été utilisé par Le Pennec et Mallat dans [114]. Fonctions uniformément régulières Dans cette thèse, on considère des exposants de 2 αrégularité α > 0 non nécessairement entiers. Si Ω ⊂ R est un ouvert, on note C (Ω) l’espace des fonctions α-hölderiennes d’ordre α sur Ω. Ce sont les fonctions f : Ω→R ayant des dérivées partielles jusqu’à l’ordre [α] vérifiant   a +a a +a1 2 1 2∂ f(x) ∂ f(y) [α]−αmax sup − x−ya a a a1 2 1 2∂x ∂x ∂x ∂xa +a =[α] 2 1 2 1 2def.  1 2 (x,y)∈Ω +f α = max < ∞ C (Ω) a +a1 2∂ f(x)max sup a a1 2∂x ∂xa +a 6α1 2 1 2x∈Ω avec def. ⌊α⌋ si α∈/N, [α] = α−1 si α∈N. 2 2Fonctionsavecunerégularitégéométrique Unefonctionf ∈ L ([0,1] )possèdeune αrégularité géométrique C si α 2f = f ou f = f ∗h avec f ∈C (Λ) pour Λ=[0,1] −{γ } .i 16i6G αLe noyau de lissage h est C et possède un support de taille s >0. On suppose de plus −(2+α) αqu’il vérifie h 6 s .C αLes courbes de contours γ sont C et ne s’intersectent pas tangentiellement.i Les courbes γ sont les contours des objets géométriques formant l’image à analyser. Lesi discontinuités que définissent ces courbes sont dues aux phénomènes d’occlusion entre les objets, qui de plus crée des jonctions en T et des croisements. Le lissage par un noyau h modélise le phénomène de diffraction, qui génère un flou d’image a priori inconnu. 4 Chapitre 1 Introduction 1.2.2 Cette classe de fonctions géométriques constitue le modèle mathématique qui permet d’ob- tenir tous les résultats garantissant la qualité de la représentation à l’aide de bandelettes orthogonales. Pourtant, comme on l’a vu à la figure 1.1 (d-f), la plupart des images contiennent des structures géométriques plus complexes. Dans un premier temps, il est donc important de construire des algorithmes suffisamment robustes pour améliorer le traitement des images même dans ces cas difficiles. Dans un deuxième temps, nous identifions les difficultés que représentent ces parties texturées et présentons quelques pistes pour aller plus loin dans l’analyse géométrique. 1.2 Succès et échecs des bases d’ondelettes Lecadremathématiqueclassiquepourconstruireunereprésentationcompactedefonctions estceluidel’approximationdansunebaseorthonormée.Danscettesection,nousprésentons ce cadre et détaillons le cas des bases d’ondelettes, populaires en compression d’images. 1.2.1 Meilleure approximation orthogonale 2 2L’approximation d’une fonction f ∈ L ou d’un vecteur f ∈ ℓ se calcule de façon simple 2 2dès lors que l’on dispose d’une base orthonormée B = {g } de L ou ℓ . Il suffit en effetμ μ d’imposer un seuil T > 0 et de rejeter les coefficients de la décomposition de f dans B d’amplitude inférieure à T def. def. f = f, g g avec M = Card{ \| f, g | >T},M μ μ μ | f,g |>Tμ 2 2où , est le produit scalaire canonique sur L ou ℓ . Lafonctionf ainsiobtenueestlameilleureapproximationdef avecMcoefficientsdanslaM baseB. Cette approximation est non linéaire puisque les coefficients f, g pris en compteμ pour approcher f sont choisis en fonction de f. Pour obtenir une approximation efficace en 2norme L , il s’agit donc de trouver une base exploitant au mieux les propriétés de la classe de fonctions considérée. Pour les fonctions uniformément régulières, la base de Fourier est optimale pour effectuer 2de telles approximations. Pour les fonctions de L ([0,1]) ayant des discontinuités, les bases d’ondelettes, décrites au prochain paragraphe, permettent de pallier au problème de l’ana- lyse de Fourier en exploitant pleinement l’adaptivité qu’autorise le choix des coefficients à garder. 1.2.2 Bases d’ondelettes 1D LesondelettesontétéintroduitesdanslestravauxdeDaubechies[54],Mallat[127]etMeyer [136].CestravauxgénéralisentlesprocéduresdecodagepyramidalescommecelledeBurtet 1.2.2 Succès et échecs des bases d’ondelettes 5 Adelson [26] et le codage en sous-bandes utilisé par Vetterli [191] pour le codage d’images. Les ouvrages de Daubechies [55], Mallat [128], Meyer [137] et Vetterli [192] constituent des références sur l’approximation en ondelettes. 2 2Une base d’ondelettes B de L ([0,1] ) est obtenue en dilatant et translatant une fonction ψ def. def.−j −j/2 −jB = ψ j60, n=0...2 −1 avec ψ (x) = 2 ψ(2 x−n).jn jn 2Il est nécessaire de modifier les ondelettes dont le support intersecte le bord de [0,1] pour obtenir une base orthonormée. Pour les développements théoriques du chapitre 2 il suffit de considérer une extension périodique des fonctions de base à l’extérieur du carré. La fonction ψ possède principalement deux propriétés : Elle est oscillante. La fonction ψ a ainsi un nombre p suffisamment élevé de moments nuls 1 k∀k6 p−1, ψ(x)x dx=0. 0 αSi une fonction f est régulière, par exemple de classe C sur un intervalle
Voir icon more
Alternate Text