Contributions à la réduction de dimension

icon

169

pages

icon

Français

icon

Documents

Écrit par

Publié par

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
icon

169

pages

icon

Français

icon

Documents

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Sous la direction de Jérôme Saracco, Marie Chavent
Thèse soutenue le 20 novembre 2009: Bordeaux 1
Cette thèse est consacrée au problème de la réduction de dimension. Cette thématique centrale en Statistique vise à rechercher des sous-espaces de faibles dimensions tout en minimisant la perte d'information contenue dans les données. Tout d'abord, nous nous intéressons à des méthodes de statistique multidimensionnelle dans le cas de variables qualitatives. Nous abordons la question de la rotation en Analyse des Correspondances Multiples (ACM). Nous définissons l'expression analytique de l'angle de rotation planaire optimal pour le critère de rotation choisi. Lorsque le nombre de composantes principales retenues est supérieur à deux, nous utilisons un algorithme de rotations planaires successives de paires de facteurs. Nous proposons également différents algorithmes de classification de variables qualitatives qui visent à optimiser un critère de partitionnement basé sur la notion de rapports de corrélation. Un jeu de données réelles illustre les intérêts pratiques de la rotation en ACM et permet de comparer empiriquement les différents algorithmes de classification de variables qualitatives proposés. Puis nous considérons un modèle de régression semiparamétrique, plus précisément nous nous intéressons à la méthode de régression inverse par tranchage (SIR pour Sliced Inverse Regression). Nous développons une approche basée sur un partitionnement de l'espace des covariables, qui est utilisable lorsque la condition fondamentale de linéarité de la variable explicative est violée. Une seconde adaptation, utilisant le bootstrap, est proposée afin d'améliorer l'estimation de la base du sous-espace de réduction de dimension. Des résultats asymptotiques sont donnés et une étude sur des données simulées démontre la supériorité des approches proposées. Enfin les différentes applications et collaborations interdisciplinaires réalisées durant la thèse sont décrites.
-Statistique multidimensionnelle
-données qualitatives
-rotation
-classification de variables
-régression semiparamétrique
-méthode de régression inverse par tranchage
-condition de linéarité
-bootstrap
This thesis concentrates on dimension reduction approaches, that seek for lower dimensional subspaces minimizing the lost of statistical information. First we focus on multivariate analysis for categorical data. The rotation problem in Multiple Correspondence Analysis (MCA) is treated. We give the analytic expression of the optimal angle of planar rotation for the chosen criterion. If more than two principal components are to be retained, this planar solution is used in a practical algorithm applying successive pairwise planar rotations. Different algorithms for the clustering of categorical variables are also proposed to maximize a given partitioning criterion based on correlation ratios. A real data application highlights the benefits of using rotation in MCA and provides an empirical comparison of the proposed algorithms for categorical variable clustering. Then we study the semiparametric regression method SIR (Sliced Inverse Regression). We propose an extension based on the partitioning of the predictor space that can be used when the crucial linearity condition of the predictor is not verified. We also introduce bagging versions of SIR to improve the estimation of the basis of the dimension reduction subspace. Asymptotic properties of the estimators are obtained and a simulation study shows the good numerical behaviour of the proposed methods. Finally applied multivariate data analysis on various areas is described.
-Mutivariate analysis categorical data rotation variable clustering semiparametric regression Sliced Inverse Regression linearity condition bootstrap
Source: http://www.theses.fr/2009BOR13871/document
Voir icon arrow

Publié par

Nombre de lectures

39

Langue

Français

Poids de l'ouvrage

4 Mo

Univ
MCF-HDR.
P
-
HU
d'ordre

:
Bordeaux
3871
I
THÈSE
Rennes
présen
M.
tée
Gilb
à
PR
L'UNIVERSITÉ
2009
BORDEA
Victor
UX
thèse
I
cam
ÉCOLE
H.A.L.
DOCTORALE
of
DE
PR
MA
s-Sud
THÉMA
A
TIQUES
M.
ET

INF
thèse
ORMA
CHA
TIQUE
ersi
par
Bordeaux
V
directrice
anessa
F
KUENTZ
MCF-HDR.
POUR
us
OBTENIR
M.
LE
PR
GRADE
t
DE
Rapp
DOCTEUR
hel
SPÉCIALITÉ
Univ
:
a
Mathématiques
orteur
Appliquées
SAPOR
-
OF.
Statistique
Rapp
*********************
SARA
C
Univ
ONTRIBUTIONS
tesqui
À
Directeur
LA
1
RÉDUCTION
e
DE
VENT
DIMENSION
Univ
*********************

Souten
Segalen
u
I
e
Co
le
de
20
M.
no
rançois
v
SSON
em
Agro
bre
p
2009
Ouest,
à
Examinateur
l'Institut
Henk
de
KIERS
Mathématiques
OF.
de
ersi
Bordeaux
y
Dev
Groningen
an
orteur
t
Jean-Mic
la
POGGI
commission
OF.
d'examen
ersi
comp
P
osée
ri
de
Rapp
:
M.
M.
ert
Bernard
T
BER
PR
CU
CNAM
PR
aris
OF.
orteur
Univ
Jérôme
ersi
CCO

OF.
Bordeaux
ersi
I
Mon
Présiden
eu
t
IV
du
de
jury
-
Mme
Ma
ri
◦Nap
A
a,
toi
pp
et
gra
ts
v
Je
our
tiens
l'enseignemen
tout
our
d'ab
Bordeaux
ord
ensem
à
faire
remercier
t
très
er
c
h
haleureus
te
e
ailler
men
ense
t
es
mes
je
d
t
eux
dans
directeurs
p
de
uit
thèse,
p
Marie
cen
Cha
amitié,
v
Pierric
en
on
t
b
et
sa
Jérôme
réel
Saracco,
our
p
Aubin,
our
amitié.
leur
et
disp
v
onibilité,
à
leurs
soutien
remarques
réussite
p
conseils,
ertinen
p
tes,
Me
leurs
Bordeaux
précieux
y
conseils
our
et
j'ai
les
Un
nom
Man
breuses
Oli
connaissances
Gridou
statistiques
et
qu'ils
éga-
m'on
et
t
soirées
p
momen
ermis
indisp
d'acquérir.
de
La
remercier
façon
en
don
lui
t
do
ils
t
on
do
t
abien,
co
Une
dirigé
m'en
cette
son
thèse
nous
m'a
ons
p
plus
ermis
ma
de
lignes
m'épanouir
ma
duran
donnen
t
t.
ces
t
trois
Merci
années.
vie.
J'ai
ts
toujours
de
sen
précieux.
ti
p
un
à
soutien
tillesse.
moral,
qui
un
naître
in
déjà
térêt
Merci
p
qualité
our
don
mon
énécié
tra
leur
v
tout
ail,
Brigitte,
une
Christine,
atten
F
tion
i
particulière
Je
et
our
une
fous
am
b
biance
Merc
de
t
tra
Jessica,
v
t
ail
amitié.
toujours
ensem
placée
été
sous
de
le
de
signe
à
de
réus-
la
thèse.
b
égalemen
onne
p
h
et
u
tra
m
v
eu
u
r.
Merci
T
ts
out
qui
cela
tous
a
plupart
été
Je
une
Bertrand,
grande
Delphine
source
an
de
tion
motiv
Ludi
ation,
de
qui
p
m'a
umour,
donné
sions
conance
v
en
les
moi
ts
et
Enn
m'a
remerciemen
p
t
ermis
sans
d'év
pas
oluer
ui.
sereinemen
maman
t
eurette
dans
qu'elles
l
et
e
m'app
monde
es
de
un
la
dans
Rec
ma
herc
Jean
he.
de
Je
présence,
remercie
en-
égalemen
son
t
momen
très
son
sincèremen
moi
t
à
H
ds-paren
enk
leur
Kiers,
égalemen
Professeur
et
à
leur
l'
ersité
Univ
2
ersité
m'on
de
vu
Groningen
il
(P
a
a
h
ys-Bas),
ans.
Jean-Mic
p
hel
la
P
de
ogg
t
i
t
,
b
Professeur
et
à
our
l'Uni
amitié.
v
merci
ersité
particuli
P
à
aris-Sud
Bedr'Eddine,
et
ue,
Gil-
Vin
b
t,
ert
red',
Sap
v
orta,
er
Professeur
Jean-Baptiste.
au
remercie
CNAM
p
à
son
P
ses
aris,
rires
p
sa
our
onne
a
umeur.
v
i
oir
lemen
accepté
à
d'
k,
ê
Danaëlle
tre
Vincen
les
p
rapp
leur
orteurs
Les
de
passées
mon
ble
tra
t
v
des
ail
ts
de
déten
thèse.
et
Je
plaisir
les
ensables
remercie
la
p
onne
our
site
le
ma
temps
Je
qu'ils
oudrais
on
t
t
Benoît
accordé
our
à
sympathie
la
son
relecture
train,
de
v
ce
a
man
ec
u
est
scrit
n
et
plaisir.
p
aux
our
ctoran
l'in
de
térêt
1
qu'ils
son
lui
d'ailleurs
on
p
t
la
accordé.
déjà
Merci
cteurs.
à
p
Bernard
à
Bercu,
F
professeur
Julien,
à
et
l'Univ
Je
ersité
.
Bordeaux
men
1,
particulière
et
our
F
qui
rançois
toure
Husson,
son
Maître
Merci
de
our
Conférences
h
à
l
Agro
discus-
campus
que
Ouest
a
(Rennes),
ons
p
tous
our
b
m'a
momen
v
passés
oir
ble.
fait
mes
l'honneur
grands
de
ts
particip
on
er
à
à
famille
mon
qui
jury
n'écrirais
de
ces
thèse.
aujourd'h
Merci
Merci
innimen
ma
t
et
à
so
Chan
p
tal
l'amour
Lacom
me
blez
t
s
le
a
qu'elles
n
orten
s
Ell
qui
on
cette
été
merv
élémen
eilleuse
clé
a
la
v
de
en
thèse.
ture
à
qu'a
de
été
partie
ma
ma
th
Sa
èse
ses
n'aurait
ses
pas
couragemen
eu
et
lieu.
réconfort
Je
les
remercie
ts
viv
doute
emen
t
t
our
tous
très
les
Merci
professeurs
mes
de
n
l'UF
ts
R
our
S
amour.
c
rci
i
t
ences
Marie-Jeanne
et
Alain
Mo
our
délisation
gen
de
Remerciemen
l'Univtiv
.
data
able
.
des
.
matières
laten
1
.
Présen
.
tation
.
générale
2.2.3
5
.
1.1
.
Description
les
de
21
la
.
thèse
Rotation
.
.
.
.
.
dence
.
.
.
.
.
.
.
duction
.
1
.
2.1.2.2
.
.
.
.
.
.
.
réelles
.
Conclusions
.
.
.
a
.
.
.
.
.
tro
.
.
.
27
.
.
.
.
.
.
.
.
.
.
.
.
.
2.3
5
.
1.2
.
Liste
.
des
.
tra
.
v
partitionnemen
aux
orts
.
.

Voir icon more
Alternate Text