Logiciel R Statistique Non Paramétrique BR3 doc Page

icon

31

pages

icon

Français

icon

Documents

Écrit par

Publié par

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
icon

31

pages

icon

Français

icon

Documents

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus


  • fiche - matière potentielle : utilisation du logiciel


______________________________________________________________________ Logiciel R / Statistique Non Paramétrique / BR3.doc / Page 1 / 25/10/00 Fiche d'utilisation du logiciel 3 – Statistique non paramétrique D. Chessel & J. Thioulouse Résumé La fiche contient le matériel nécessaire pour une séance de travaux dirigés sur R consacrée à la statistique non paramétrique. Les tests classiques directement accessibles sont illustrés par les exemples de P. Dagnélie (1975 - Théories et méthodes statistiques : Analyse statistique à plusieurs variables, Tome 2. Les presses agronomiques de Gembloux, Gembloux. 1-362). Les tests sur les espaces à respectivement n! , ( )mn et pn éléments, dont les solutions analytiques sontconnues, ont des solutions simulées basée sur la fonction sample. Les exemples de rééchantillonnage sont abordées (jackknife et bootstrap). L'installation des librairies necessaires est décrite. Plan 1. BASES DU RAISONNEMENT STATISTIQUE.................................................................2 1.1. Vraisemblance d'une hypothèse....................................................................2 1.2. Rejet d'une hypothèse ...................................................................................5 1.3. Intervalle de confiance...................................................................................7 1.4.

  • penser aux ours blancs

  • nan

  • statistique fishérienne

  • tests classiques

  • espace probabilisé

  • estimation au maximum de vraisemblance

  • presses agronomiques de gembloux

  • statistique

  • hypergeometric distribution

  • installation des librairies necessaires


Voir icon arrow

Publié par

Nombre de lectures

75

Langue

Français

Fiche d’utilisation du logicie
3 –Statistique non paramétrique D. Chessel & J. Thioulouse 
Résumé La fiche contient le matériel nécessaire pour une séance de travaux dirigés sur R consacrée à la statistique non paramétrique. Les tests classiques directement accessibles sont illustrés par les exemples de P. Dagnélie (1975 -méthodes statistiques : Analyse statistique àThéories et plusieurs variables, Tome 2. Les presses agronomiques de Gembloux, Gembloux. 1-362). Les tests sur les espaces à respectivementn! ,n etpnéléments, dont les solutions m analytiques sontconnues, ont des solutions simulées basée sur la fonctionsample. Les exemples de rééchantillonnage sont abordées (jackknifeetbootstrap). L’installation des librairies necessaires est décrite. Plan 1.  ................................................................. 2BASES DU RAISONNEMENT STATISTIQUE 1.1. ..................2.............nce dunaisemblasè.e.... eyhopht................................Vr 1.2. undt jeRe.....esèhtopyh e..........5.................................................................... 1.3. ......................................7.........................Intlle ervaifnoc ed....ecna................ 1.4. ........ecnassiu pontincFo................................................................9................ 2. 2.1.......................................................SEUQI........................................TESTS CLASS 2.1. Test de la médiane (op. cit. p. 381) .............................................................13 2.2. ........................13................................( noxocl.tic .po4)38.  p........Tee Wist d 2.3. Test de Kurskal et Wallis (op. cit. p. 392)....................................................14 2.4. Test de Friedman (op. cit. p. 394) ...............................................................15 2.5. ................................. ..i.c...t.p. . ...4.8...)......s.t.Te.5u1 . .di2Chop (................ 3.  16SIMULATIONS DANS LES ESPACES NON PARAMETRIQUES ................................... 3.1. Quelle est la loi du plus petit ? .....................................................................17 3.2. Le nombre de suites est gaussien pour N>=10 et N-M>=10 ? ...................22 3.3. ..................................................23........oN ed erbms vicase....des................. 3.4. nad sfuœ siorT..s.onoc cnqcis ................................24.................................... 4. LES TECHNIQUES DE RE ECHANTILLONNAGE......................................................... 24 4.1. ..........................eiriar lib unellernstaI.2..4........................................................ 4.2. ................................tsoob....aptr..................................62................................ 4.3. .............................................efi..................03........................................ajkcnk ______________________________________________________________________  Logiciel R / Statistique Non Paramétrique / BR3.doc / Page 1 / 25/10/00
1.
1.1.
 
Bases du raisonnement statistique De la connaissance d’un espace probabilisé, on peut déduire ce qui va se passer sur un échantillon, du genre si on tire une boule au hasard dans une urne contenant 7 rouges et 3 bleues, 7 fois sur 10 on aura une rouge ! On peut inverser totalement la question : si une urne contient 10 boules et qu’en tirant au hasard on obtient 3 rouges qu’est-ce qu’on peut dire des autres ? C’est ce qu’on appelle l’inférence statistique.
Vraisemblance d’une hypothèse La base du raisonnement est dans la fonction de vraisemblance. Prenons un exemple. Il y a dans l’amphi 100 personnes et l’enseignant X veut savoir combien d’étudiants ont une opinion favorable de ce qu’il raconte. Le plus efficace est de les interroger tous un par un. Mais c’est long et pénible. Alors X en prend 5 au hasard et pose la question « Pensez vous que la statistique est intéressante? ». C’est OUI 4 fois et NON 1 fois. On peut dire que cet échantillon représente tout à fait la réalité et que 80% des étudiants s’intéressent à la statistique. On peut dire aussi bien que X a eu beaucoup de chance et que la petite minorité de ceux qui s’intéressent à la statistique est sur-représentée. Il y a exactement 101 hypothèsesa priori dans l’amphi, il y a :métudiants qui répondent OUI à la question. Ces hypothèses notéesH0,H1,...,H100correspondent aux valeurs 0, 1, 2, ..., 100, valeurs que peut prendre l’inconnuem(a posteriori, après l’échantillonnage, on peut éliminercertainement cas 100, 99, 98, 97 et 0) mais lesmest inconnu et peut prendrea priori0 à 100. Nous allons étudier ces 101 hypothèses.les valeurs Soit l’hypothèseH30. Sim 30, en tirant au hasard 5 étudiants sur 100 on aura vaut 1 l’observation 0, 1, 2, 3, 4 ou 5 avec les probabilitésP(0),P(1),...,P( Il y a5 .çæ 500 è façons de choisir 5 étudiants et : æ30ö æ70 P( )çj÷5-çj è ø j=10è0 æ ö ç5÷ è ø
> dhyper(4,30,70,5) [1] 0.02548 La probabilité de trouver 4 (le résultat observé) est alors 0.02548.  > ?Hypergeometric  Hypergeometric package:base R Documentation  The Hypergeometric Distribution  Description:   Density, distribution function, quantile function and random ______________________________________________________________________  Logiciel R / Statistique Non Paramétrique / BR3.doc / Page 2 / 25/10/00
 generation for the hypergeometric distribution.  Usage:   dhyper(x, m, n, k, log = FALSE)  phyper(q, m, n, k, lower.tail = TRUE, log.p = FALSE)  qhyper(p, m, n, k, lower.tail = TRUE, log.p = FALSE)  rhyper(nn, m, n, k)  Arguments:   x, q: vector of quantiles representing the number of white balls  drawn without replacement from an urn which contains both  black and white balls.   m: the number of white balls in the urn.   n: the number of black balls in the urn.   k: the number of balls drawn from the urn.   p: probability, it must be between 0 and 1.   nn: the number of observations to be generated.  log, log.p: logical; if TRUE, probabilities p are given as log(p).  lower.tail: logical; if TRUE (default), probabilities are P[X <= x],  otherwise, P[X > x].  Value:   `dhyper' gives the density, `phyper' gives the distribution  function, `qhyper' gives the quantile function, and rhyper ` '  generates random deviates.  References:   Johnson, N. L., Kotz, S., and Kemp, A. W. (1992) Univariate  Discrete Distributions, Second Edition. New York: Wiley.  > ?Poisson l’uniformité de la construction Voir > ?Binomial La probabilité d’observer le résultat sous une hypothèse H arbitraire est la vraisemblance de cette hypothèse pour cette observation.Nous pouvons tracer la valeur de la vraisemblance en fonction de l’hypothèse. Ce n’est pas une loi de probabilité mais une fonction dont les valeurs sont des probabilités pour des lois différentes. Ce que le help ne dit pas : on peut mettre plusieurs valeurs pour le premier paramètre.  > dhyper(4,0:10,1,5) [1] NaN NaN NaN NaN 1.0000 0.8333 0.7143 0.6250 0.5556 0.5000 [11] 0.4545 Warning message: NaNs produced in: dhyper(x, m, n, k, log) C’est normal, trouver 4 blanches sur 5 tirées quand il n’y en a pas, c’est trop.  > dhyper(4,6,1,5) [1] 0.7143 > dhyper(4,4:10,1,5) [1] 1.0000 0.8333 0.7143 0.6250 0.5556 0.5000 0.4545 Ce que le help ne dit pas : on peut mettre plusieurs valeurs pour le second paramètre.  ______________________________________________________________________ Logiciel R / Statistique Non Paramétrique / BR3.doc / Page 3 / 25/10/00
Voir icon more
Alternate Text