Mode`le line´aire et se´lection de variables
Minimisation de la normeℓ1
Quelques simulations
Discussion
Proble`mes sparses en statistique
GDR MASCOT NUM - IHP, Paris
Je´re´mie Bigot
Institut de Mathe´matiques de Toulouse, UPS
Avril 2008
`Problemes sparses en statistiqueMode`le line´aire et se´lection de variables
Minimisation de la normeℓ1
Quelques simulations
Discussion
1 Mode`le line´aire et se´lection de variables
2 Minimisation de la norme ℓ1
3 Quelques simulations
4 Discussion
`Problemes sparses en statistiqueMode`le line´aire et se´lection de variables
Minimisation de la normeℓ1
Quelques simulations
Discussion
Mode`le line´aire
tObservations : Y = (Y ,..., Y ) telles que1 n
∗ 2Y = Xβ +ǫ, avecǫ∼ N(0,σ I ),n
∗ pX = [X ,..., X ] matrice n× p connue, etβ ∈R vecteur de1 p
parame`tres a` estimer.
´ ´ ´Exemple : regression nonparametrique et decomposition dans une
base de Fourier
ℓj
Y = f(x )+ǫ, j = 1,..., n, x = , ou` ℓ ∈{1,..., p}j j j j j
p
p p
j∗ −i2π(k−1)x ∗j= β e +ǫ = β X +ǫ,j jk k k
k=1 k=1
j −i2π(k−1)xjavec X = e .k
Cas orthogonal : n = p et X matrice orthogonale
`Problemes sparses en statistiqueMode`le line´aire et se´lection de variables
Minimisation de la normeℓ1
Quelques simulations
Discussion
De´composition en Fourier (sans bruit)
702
1.5 60
1
50
0.5
40
0
30
−0.5
20
−1
10
−1.5
−2 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 10 20 30 40 50 60 70
n = p = 128
∗Remarque : #{k ;β = 0} est petit !k
∗Le vecteurβ est dit sparse (creux) dans ce cas.
`Problemes ...
Voir