Statistical tests based on N-distances ; Statistinių hipotezių tikrinimas, naudojant N-metrikas

icon

148

pages

icon

Documents

2010

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

148

pages

icon

Documents

2010

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

VILNIUS GEDIMINAS TECHNICAL UNIVERSITYINSTITUTE OF MATHEMATICS AND INFORMATICSAleksej BAKŠAJEVSTATISTICAL TESTSBASED ON N-DISTANCESDOCTORAL DISSERTATIONPHYSICAL SCIENCES, MATHEMATICS (01P)Vilnius 2010The scientific work was prepared at Institute of Mathematics and Informatics in2005–2009.Scientific SupervisorProf Dr Habil Rimantas RUDZKIS (Institute of Mathematics and Informatics,Physical Sciences, Mathematics –01P).Scientific ConsultantProf Dr Habil Yurij TYURIN (Lomonosov Moscow State University,Physical Sciences, Mathematics –01P).VGTU leidyklos TECHNIKA 1715-M mokslo literatūros knygahttp://leidykla.vgtu.ltISBN 978-9955-28-535-9© VGTU leidykla TECHNIKA, 2010© Aleksej Baksajev, 2010aleksej.bakshaev@gmail.comVILNIAUS GEDIMINO TECHNIKOS UNIVERSITETASMATEMATIKOS IR INFORMATIKOS INSTITUTASAleksej BAKŠAJEVSTATISTINIŲ HIPOTEZIŲ TIKRINIMAS,NAUDOJANT N-METRIKASDAKTARO DISERTACIJAFIZINIAI MOKSLAI, MATEMATIKA (01P)Vilnius 2010Disertacija rengta 2004–2009 metais Matematikos ir informatikos institute.Mokslinis vadovasprof. habil. dr. Rimantas RUDZKIS (Matematikos ir informatikos institutas,fiziniai mokslai, matematika –01P).Mokslinis konsultantasprof. habil. dr. Yurij TYURIN (Maskvos valstybinis M. V. Lomonosovouniversitetas, fiziniai mokslai, matematika –01P).AbstractThe thesis is devoted to the application of a new class of probability metrics,N-distances, introduced by Klebanov (Klebanov, 2005; Zinger et al.
Voir icon arrow

Publié le

01 janvier 2010

Nombre de lectures

34

Poids de l'ouvrage

1 Mo

VILNIUS GEDIMINAS TECHNICAL UNIVERSITY
INSTITUTE OF MATHEMATICS AND INFORMATICS
Aleksej BAKŠAJEV
STATISTICAL TESTS
BASED ON N-DISTANCES
DOCTORAL DISSERTATION
PHYSICAL SCIENCES, MATHEMATICS (01P)
Vilnius 2010The scientific work was prepared at Institute of Mathematics and Informatics in
2005–2009.
Scientific Supervisor
Prof Dr Habil Rimantas RUDZKIS (Institute of Mathematics and Informatics,
Physical Sciences, Mathematics –01P).
Scientific Consultant
Prof Dr Habil Yurij TYURIN (Lomonosov Moscow State University,
Physical Sciences, Mathematics –01P).
VGTU leidyklos TECHNIKA 1715-M mokslo literatūros knyga
http://leidykla.vgtu.lt
ISBN 978-9955-28-535-9
© VGTU leidykla TECHNIKA, 2010
© Aleksej Baksajev, 2010
aleksej.bakshaev@gmail.comVILNIAUS GEDIMINO TECHNIKOS UNIVERSITETAS
MATEMATIKOS IR INFORMATIKOS INSTITUTAS
Aleksej BAKŠAJEV
STATISTINIŲ HIPOTEZIŲ TIKRINIMAS,
NAUDOJANT N-METRIKAS
DAKTARO DISERTACIJA
FIZINIAI MOKSLAI, MATEMATIKA (01P)
Vilnius 2010Disertacija rengta 2004–2009 metais Matematikos ir informatikos institute.
Mokslinis vadovas
prof. habil. dr. Rimantas RUDZKIS (Matematikos ir informatikos institutas,
fiziniai mokslai, matematika –01P).
Mokslinis konsultantas
prof. habil. dr. Yurij TYURIN (Maskvos valstybinis M. V. Lomonosovo
universitetas, fiziniai mokslai, matematika –01P).Abstract
The thesis is devoted to the application of a new class of probability metrics,
N-distances, introduced by Klebanov (Klebanov, 2005; Zinger et al., 1989), to the
problems of verification of the classical statistical hypotheses of goodness of fit,
homogeneity, symmetry and independence.
First of all a construction of statistics based on N-metrics for testing mentioned
hypotheses is proposed. Then the problem of determination of the critical region
of the criteria is investigated. The main results of the thesis are connected with the
asymptotic behavior of test statistics under the null and alternative hypotheses. In
general case the limit null distribution of proposed in the thesis tests statistics is
established in terms of the distr of infinite quadratic form of random normal
variables with coefficients dependent on eigenvalues and functions of a certain in-
tegral operator. It is proved that under the alternative hypothesis the test statistics
are asymptotically normal. In case of parametric hypothesis of goodness of fit par-
ticular attention is devoted to normality and exponentiality criteria. For hypothesis
of homogeneity a construction of multivariate distribution-free two-sample test is
p¡1proposed. Testing the hypothesis of uniformity on hypersphereS in more detail
p=1;2 cases are investigated.
In conclusion, a comparison of N-distance tests with some classical criteria is
provided. For simple hypothesis of goodness of fit in univariate case as a measure
for comparison an Asymptotic Relative Efficiency (ARE) by Bahadur (Bahadur,
1960; Nikitin, 1995) is considered. In parallel to the theoretical results the empiri-
cal comparison of the power of the tests is examined by means of Monte Karlo sim-
ulations. Besides simple and composite hypotheses of goodness of fit, hypotheses
1 2of uniformity onS andS , we consider two-sample tests in uni- and multivariate
cases. A wide range of alternative hypotheses are investigated.
vReziumė
Disertacinis darbas yra skirtas N-metrikų teorijos (Klebanov, 2005; Zinger et
al., 1989) pritaikymui klasikinėms statistinėms suderinamumo, homogeniškumo,
simetriškumo bei nepriklausomumo hipotezėms tikrinti.
Darbo pradžioje pasiūlytas minėtų hipotezių testinių statistikų konstravimo bū-
das, naudojant N-metrikas. Toliau nagrinėjama problema susijusi su suformuotų
kriterijų kritinės srities nustatymu. Pagrindiniai darbo rezultatai yra susiję su pa-
siūlytų kriterijaus statistikų asimptotiniu skirstiniu. Bendru atveju N-metrikos sta-
tistikų asimptotinis skirstinys esant nulinei hipotezei sutampa su Gauso atsitiktinių
dydžių begalinės kvadratinės formos skirstiniu. Alternatyvos atveju testinių statis-
tikų ribinis skirstinys yra normalusis. Sudėtinės suderinamumo hipotezės atveju
išsamiau yra analizuojami normalumo ir ekponentiškumo kriterijai. Daugiamačiu
atveju pasiūlyta konstrukcija, nepriklausanti nuo skirstinio homogeniškumo testo.
p¡1Tikrinant tolygumo hipersferojeS hipotezę detaliau yra nagrinėjami apskritimo
p=1 ir sferosp=2 atvejai.
Darbo pabaigoje lyginami pasiūlytos N-metrikos bei kai kurie klasikiniai krite-
rijai. Neparametrinės suderinamumo hipotezės vienamačiu atveju, kaip palyginimo
priemonė, nagrinėjamas Bahaduro asimptotinis santykinis efektyvumas (Bahadur,
1960; Nikitin, 1995). Kartu su teoriniais rezultatais pasiūlytų N-metrikos tipo testų
galingumas ištirtas, naudojant Monte-Karlo metodą. Be paprastos ir sudėtinės su-
derinamumo hipotezių yra analizuojami homogeniškumo testai vienamačiu ir dau-
giamačiu atvejais. Ištirtas platus alternatyvių hipotezių diapazonas.
viNotations
(X;U) measurable space;
N the set of natural numbers;
pR the set ofp-dimensional real vectors;
C the set of complex numbers;
px a real vector(x ;:::;x ) inR ;1 p
p p[0;1] the unit square inR ;
p¡1 pS the hypersphere inR ;
pk¢k the Euclidean norm inR ;
ph¢;¢i the scalar product inR ;
pX;Y;Z random vectors inR ;
X ;:::;X the sample of independent observations ofX;1 n
F (x) the empirical distribution function based on the samplen
X ;:::;X ;1 n
EX the mean ofX;
varX the variance ofX;
cov(X;Y) the covariance betweenX andY ;
d
¡! weak convergence;
viiP
¡! convergence in probability;
x^y min(x;y) for real numbersx andy;
x_y max(x;y) for realx andy;
p pC([0;1] ) the set of continuous functionsx:[0;1] !R.
viiiTurinys
INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1. AUXILIARY RESULTS . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.1. N-distances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2. The distribution functions of quadratic forms . . . . . . . . . . . 24
2. GOODNESS OF FIT TEST . . . . . . . . . . . . . . . . . . . . . . . 29
2.1. Simple hypothesis . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.1. Asymptotic distribution of test statistic . . . . . . . . . . 30
2.1.2. Univariate case . . . . . . . . . . . . . . . . . . . . . . . 33
2.1.3. Multivariate case . . . . . . . . . . . . . . . . . . . . . . 40
2.2. Composite hypothesis . . . . . . . . . . . . . . . . . . . . . . . . 51
2.2.1. Asymptotic distribution of test statistic . . . . . . . . . . 51
2.2.2. Multivariate normality test . . . . . . . . . . . . . . . . . 65
2.3. Conclusions of Chapter 2 . . . . . . . . . . . . . . . . . . . . . . 69
3. NONPARAMETRIC TESTS BASED ON N-DISTANCES . . . . . . 71
3.1. Homogeneity test . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.1.1. Asymptotic distribution of test statistic . . . . . . . . . . 72
3.1.2. Univariate case . . . . . . . . . . . . . . . . . . . . . . . 75
ix3.1.3. Multivariate case . . . . . . . . . . . . . . . . . . . . . . 77
3.1.4. Distribution-free two-sample test . . . . . . . . . . . . . . 82
3.2. Tests of uniformity on the hypersphere . . . . . . . . . . . . . . . 84
3.2.1. Asymptotic distribution of test statistic . . . . . . . . . . 87
3.3. Symmetry and independence tests . . . . . . . . . . . . . . . . . 96
3.3.1. Symmetry test . . . . . . . . . . . . . . . . . . . . . . . 96
3.3.2. Independence test . . . . . . . . . . . . . . . . . . . . . . 99
3.4. Conclusions of Chapter 3 . . . . . . . . . . . . . . . . . . . . . . 101
4. POWER COMPARISON . . . . . . . . . . . . . . . . . . . . . . . . 103
4.1. Asymptotic relative efficiency of criteria . . . . . . . . . . . . . . 103
4.2. Empirical power comparison . . . . . . . . . . . . . . . . . . . . 108
4.2.1. Simple hypothesis of goodness of fit . . . . . . . . . . . . 109
4.2.2. Composite hypothesis of goodness of fit . . . . . . . . . . 110
4.2.3. Two-sample test . . . . . . . . . . . . . . . . . . . . . . . 115
p¡14.2.4. Test of uniformity on hypersphereS . . . . . . . . . . 119
4.3. Conclusions of Chapter 4 . . . . . . . . . . . . . . . . . . . . . . 125
GENERAL CONCLUSIONS . . . . . . . . . . . . . . . . . . . . . . . . 127
BIBLIOGRAPHY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
LIST OF PUBLICATIONS ON THE TOPIC OF THE THESIS . . . . 137
x

Voir icon more
Alternate Text