Modélisation du Climat et Statistiques (2/3) Analyse(s) statistique(s) de la variabilité Et séries temporelles Pascal Yiou LSCE, Gif-sur-YvetteIntroduction et rappels Définition de la variabilité : n.f. Caractère de ce qui est variable. ( Petit Larousse en couleurs ) But de l'étude de la variabilité : décrire l’évolution temporelle (i.e., les variations, fluctuations, oscillations…) observée ou simulée. 13/10/2004 M astère UVSQ - E NSTA - I NSTNVariabilité climatique (d’après Ghil, 2002) 13/10/2004 M astère UVSQ - E NSTA - I NSTNDifficulté première • O n ne dispose que d’ une s eule réalisation du système climatique, i.e., contrairement à la plupart des expériences de physique, on ne peut pas ré péter une expérience en climatologie (à moins de fair e une expérience numérique). • O n fait alors de la statistique sur une seule trajectoire du système climatique! • O n est donc forcément limi té par la taille des jeux d’observations, c’est la « l oi des petits nombres ». 13/10/2004 M astère UVSQ - E NSTA - I NSTNPoint de départ On dispose de N × P observations temporelles, spatiales (ou les deux): temps 6 47 4 8 X ( t , x ), t = 1 K N , x = 1 K P 1 42 4 3 espace Comment réduire l’information contenue dans N × P observations à q uelques paramètres? • D ’un point de vue statistique, ét udier la variabilité r evient à trouver un modèle « s tatistique » pour représenter les données. • D ’un point de vue dynamique, on veut décrire ...
Analyse(s) statistique(s) de la variabilité Et séries temporelles
Pascal Yiou LSCE, Gif-sur-Yvette
Introduction et rappels
Définition de lavariabilité: n.f. Caractère de ce qui est variable. (Petit Larousse en couleurs)
But del'étude de la variabilité: décrire lévolution temporelle(i.e., les variations, fluctuations, oscillations) observée ou simulée.
13/10/2004
Mastère UVSQ - ENSTA - INSTN
Variabilité climatique
(daprès Ghil, 2002)
Difficulté première
On ne dispose que dune seuleréalisation du système climatique, i.e., contrairement à la plupart des expériences de physique, on ne peut pas répéter une expérience en climatologie (à moins de faire une expérience numérique).
On fait alors de la statistique surune seule système climatique!
trajectoire du
On est donc forcément limité par la taille dobservations, cest la « loi des petits nombres ».
13/10/2004
Mastère UVSQ - ENSTA - INSTN
des
jeux
Point de départ
On dispose deN×Pobservations temporelles, spatiales (ou les deux):
temps 64748 X(t,x),t=1KN,x1=41K243P espace
Commentréduirelinformation contenue dansN×P observations à quelques paramètres?
Dun point de vue statistique, étudier la variabilité revient à trouver un modèle « statistique » pour représenter les données. Dun point de vue dynamique, on veut décrire l « attracteur » sous-jacent.
13/10/2004
Mastère UVSQ - ENSTA - INSTN
Modèles statistiques simples
Modèle harmon X(t)Asin(t
que )b(t)
i
4 paramètres:A,ω,φ, etσb
Modèle auto-régressif dordreM:
X(t)
a1X(t−1)
a2X(t
2)
LaMX(t M)b(t) M+1 paramètres: (ai),i=1M, etσb
Composantes principales et EOFs
X(t,x)
13/10/2004
a1(t)E1(x)
L
aM(t)EM
(x)
M(N+P) paramètres etM<<P
Mastère UVSQ - ENSTA - INSTN
Les Séries Temporelles
Une série deNobservations (mesures instrumentales, géochimiques, simulations numériques, etc.), échantillonnées dans le temps:
X
ti
,i=1...N
En général (souhaitable!):
13/10/2004
ti+1
ti=
t
constante
Les diagnostiques de base Moyenne:X=N1i∑N=1X(ti)Variance:σ2X=N1−1Ni=∑1(X
Écart-type:σX=
2 σX
(ti
2 )−X)
tribution de probabilité:
Variations sur le thème de la variance Covarianceentre deux sériesX(t) etY(t): C=N11iN∑1(X(t)−X) (Y(ti)−Y) XY i − =
AutocovariancedeX(mémoire de la série):
CX(τ)=N
1N −1i=∑1(X(ti+τ)−X) (X(ti)−X)
CX(0)=CXX= σX2
Mesure de la mémoire de la série (ici unbruit rouge)
13/10/2004
Mastère UVSQ - ENSTA - INSTN
Qu'attend-on d'une série temporelle?
Distribution homogène des données:céosomhiticstdaé. Stationnaritéde la moyenne et de la variance: leurs estimations changent peu si on coupe la série en morceaux.
Exemples: Pasdetendance:
N+τ X(τ)=N1t∑τX(t)=X, pour toutτ =
Invariance de lautocovariance par translation: N CX(τ,τ' )=1N∑1X(ti+τ)−X X(ti+τ' )−X i= =C(−ττ' ), pour tousτ,τ' X
13/10/2004
Mastère UVSQ - ENSTA - INSTN
Hypothèses techniques
L a sérieX(t) est régulièrement échantillonnée, avec un pas de tempsδt:
X(t)
X(k
t)}k=1KN ,
Les fréquences vont donc de 0 à 1/2δt(la fréquence de Nyquist). 1 La plus petite fréquence discernable estf = (la fréquence de Rayleigh).RN t
La résolution fréquencielle optimale est 2fR. Pour simplifier, on supposera queδt =1.