Statistiqueavecdespetitséchantillons GillesCeleux Select, Inria Saclay, Université Paris Sud Gilles Celeux (Inria) Petitséchantillons 1 / 40Plan 1 Modélisation statistique Estimation du maximum de vraisemblance Choix de modèles 2 Problèmes statistiquesàinformationfaible 3 Inférencebayésienne Traduction des informations a priori en lois a priori Approximation de la loi a posteriori Illustration pour une loi de Weibull très censurée Sélection bayésienne de modèles Gilles Celeux (Inria) Petitséchantillons 2 / 40Inférence statistique dDes donnéesx = (x ,...,x ) dans R sont issues d’une loi den1 probabilité inconnue de densité f(x). Les données sont utilisées pour tirer de l’information sur cette densité f(x). Modèle paramétrique : on suppose que f(x) = f(x;θ), avec θ paramètre inconnu à estimer à partir de (x ,...,x ).1 n Gilles Celeux (Inria) Petitséchantillons 3 / 40Exemple: la loinormale Les données (x ,...,x ) représentent le poids de n objets fabriqués1 n en série. On suppose que ces poids suivent une loi normale de moyenne μ et 2de variance σ : 21 (x−μ) pf(x;θ) = exp(− ). 2σ(2π)σ 2Le paramètre à estimer est θ = (μ,σ ). GillesCeleux (Inria) Petitséchantillons 4 / 40Exemple: la loide Weibull Les données (x ,...,x ) représentent les durées de vie de nn1 matériels. Une loi couramment utilisée pour modéliser des durées de vie est la loi de Weibull. Elle utilise un paramètre d’échelle η et un paramètre de forme β : x xβ−1 βf(x;θ) = β( ) exp((− ) ) η η Le paramètre à ...