Laboratoire de Statistique M' edicale. Mod' elisation ...

icon

16

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

16

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Laboratoire de Statistique M´edicale.
Mod´elisation Statistique et Analyse de Dur´ees de
Survie.
March 14, 2002
LesprincipauxaxesderecherchedulaboratoiredeStatistiqueM´edicaledel’Universit´eParis
5:
† l’analyse des dur´ees de survie,
† les mod`eles markoviens,
† la mod´elisation d´eterministe et stochastique des ´epid´emies d’une population
† les variations g´eographiques
† l’analyse asymptotique de m´ethodes statistiques,
† les fondements probabilistes des m´ethodes de la statistique.
Les membres du laboratoire:
† Bernard Bru, PR `a Paris 5,
† Fabienne Comte, PR `a Paris 5,
† Catherine Huber, PR `a Paris 5,
† Odile Pons, DR `a INRA,
† Chantal Guihenneuc-Jouyaux, MC `a Paris 5,
† Thu Hoang, MC `a Paris 5,
† Virginie Lasserre, MC `a Paris 5,
† Rachid Lounes, MC `a Paris 5,
† Judith Rousseau, MC `a Paris 5,
† Natacha Heutte, Ater `a l’Universit´e de Caen,
† Yoan Madec, Ater `a l’IUT de Paris 5,
† Antoine Chambaz, moniteur `a Paris 5,
† Galle Gusto, moniteur `a Paris 5,
† Samuel Krempp, moniteur `a Paris 5.
1 Le laboratoire, qui fera prochaˆınement partie de l’´equipe CNRS MAP5, en cours de cr´eation
avec l’UFR de Mah´ematiques de Paris 5, a des collaborations avec plusieurs ´equipes travaillant
dans les domaines cit´es ci-dessus. Il fait partie de l’IFR 69 et a des liens ´etroits avec d’autres
laboratoires, en particulier l’Unit´e INSERM 472 `a Villejuif, avec qui il partage le DEA de Sant´e
Publique, l’Unit´e INSERM 170, ceux de l’Universit´e Bordeaux 2, de l’IUP de ...
Voir icon arrow

Publié par

Nombre de lectures

134

Langue

Français

:5LaboratoiredeStatistiqueMe´dicale.Mode´lisationStatistiqueetAnalysedeDure´esdeSurvie.March14,2002LesprincipauxaxesderecherchedulaboratoiredeStatistiqueMe´dicaledel’Universite´Parisl’analysedesdure´esdesurvie,lesmode`lesmarkoviens,lamode´lisationde´terministeetstochastiquedese´pide´miesd’unepopulationlesvariationsge´ographiquesl’analyseasymptotiquedeme´thodesstatistiques,lesfondementsprobabilistesdesme´thodesdelastatistique.Lesmembresdulaboratoire:BernardBru,PRa`Paris5,FabienneComte,PRa`Paris5,CatherineHuber,PRa`Paris5,OdilePons,DRa`INRA,ChantalGuihenneuc-Jouyaux,MCa`Paris5,ThuHoang,MCa`Paris5,VirginieLasserre,MCa`Paris5,RachidLounes,MCa`Paris5,JudithRousseau,MCa`Paris5,NatachaHeutte,Atera`l’Universite´deCaen,YoanMadec,Atera`l’IUTdeParis5,AntoineChambaz,moniteura`Paris5,GalleGusto,moniteura`Paris5,SamuelKrempp,moniteura`Paris5.1
Lelaboratoire,quiferaprochaıˆnementpartiedel’e´quipeCNRSMAP5,encoursdecre´ationavecl’UFRdeMahe´matiquesdeParis5,adescollaborationsavecplusieurse´quipestravaillantdanslesdomainescite´sci-dessus.Ilfaitpartiedel’IFR69etadesliense´troitsavecd’autreslaboratoires,enparticulierl’Unite´INSERM472a`Villejuif,avecquiilpartageleDEAdeSante´Publique,l’Unite´INSERM170,ceuxdel’Universite´Bordeaux2,del’IUPdeVannes,del’UTCdeCompie`gneetduCREST(Insee).Elleentretientdescollaborationssuiviesavecdesperson-nalite´sd’universite´se´trange`res,commeShulamithGross,PRa`CityUniversity,NewYork,quiapasse´l’anne´euniversitaire1999–2000a`Paris5,HectordeArazoza,PRa`l’Universite´deLaHavanea`Cuba,BrendaMcGibbon,PRa`l’Universite´deMontre´alauCanada,DariushGor-banzadeh,MCauCNAM,SylviaRichardson,DRdel’Unite´INSERMU170,ChristianRobert,PRa`l’Universite´ParisIX,IliaVontaPRa`l’Universite´deNicosiea`Chypre,etc.Lesproble`mesdelastatistiqueme´dicaledemandenta`eˆtrere´solusparunemode´lisationetdestechniquesbienadapte´es.L’analysedesdure´esdesurvieconstitueunthe`mefondamentaletreposesurdiffe´rentesapproches(S.GrossetC.Huber,O.Pons).Lesde´marchesempiriquesetbaye´siennesclassiquesonte´te´enrichiesparl’utilisationd’algorithmesstochastiquesquiper-mettentparfoisdemode´liserunee´volutionplusfinedemaladiesetdeprendreencomptedessourcesdevariationsnonobserve´es,uncontroˆled’outilsdecalculstelsquelesalgorithmesdechaıˆnesdeMarkovcache´esestalorsne´cessaire(Ch.Guihenneuc-Jouyaux,V.LasserreJ.Rousseau).D’autresproble`mesdelastatistiqueme´dicaledemandenta`eˆtrere´soluspardesme´thodesade´quates.Parexemple,pourlacomparaisondefonctionseffets-doses,onabesoindetestsnonparame´triquesefficaces(C.Huber,1997).Ilenestdemeˆmepourtesterlacrois-sancestochastiqued’unecourbe(T.Hoang,1999).Pourlasurveillancedude´veloppementducerveaudel’enfant(enrelationavecl’e´pilepsie),onabesoindede´velopperdestechniquesdede´tectiondepointsderupturedansdesmode`lesexponentiels(B.Bru,1997,R.Loune`s,1997),quisontencoursd’extensiona`desmode`lesnonparame´triques(R.Loune`s,D.Gorbanzadeh,1999).Pourlesuividecohortese´pide´miquesdeSida,onabesoindeme´thodesdiverses,dontcertainesrele`ventd’algorithmesstochastiquesetd’autresfontappela`lafoisa`desmode`lesd’e´quationsdiffe´rentiellespourladynamiquedepopulationseta`l’analysedesdure´esdesurvie(H.DeArazoza,R.Loune`s,T.Hoang,1999).1Analysedesdure´esdesurvieLastatistiquedesmode`lesdedure´espermetd’analyserlaloid’instantsd’occurrenced’e´ve´nementsa`partirdedonne´esd’observationd’individusencontinuetlacontributiondel’e´quipesurceplanestbienreconnuedepuislandesanne´es80.Outrelesapplicationsme´dicalesete´pide´miologiques,lesdomainesd’utilisationdecesme´thodessontvarie´s,avecdestravauxenfiabilite´,ende´mographie,endynamiquedepopulations.Lese´ve´nementse´tudie´speuventeˆtrelede´ce`s,l’apparitiondemaladies,latransitionendiffe´rentsstadesd’unprocessusdede´veloppementoud’e´volution.Lesuiviindividuelpermetdeprendreencomptel’e´volutiondesphe´nome`nesaucoursdutempstouteninte´grantlesparticularite´sdesindividusougroupesd’individus.Leuranalyseposedesproble`mesparticuliersdusa`cequecesobservationssontleplussouventcensure´eset/outronque´es,c’esta`direprive´esd’unepartiedel’informationqu’ellesdevraientcontenir.Depuisleurspremiersarticlesparussurcesujet,S.GrossetC.Huber(1987)etO.Pons(1986)ontde´veloppe´desmode`lesetdesme´thodespourtraitercetypededonne´es.Lesmode`lesenjeusontdetypenonparame´triques,ousemi-parame´triques.Leplusconnudesmode`lessemi-parame´triquesestlemode`ledeCox(1972),tre`slargementutilise´pourl’e´tudedepopulationssousdesconditionscontrˆole´es;ilexprimelafonctionderisqued’une´ve´nementsouslaformeduproduitd’unefonctiondebaseetd’unefonctiondere´gressionsurunTensembleZdevariablesexplicativesindividuellesobserve´es,oucovariables,λ(t|Z)=λ0(t)eβ0Z.Lesproprie´te´sasymptotiquesdesestimateursetdestestspourcesmode`lessontobtenuesleplussouventgraˆcea`destechniquesrelativesauxprocessusponctuels.2
L’e´tudedepopulationssousdesconditionspartiellementcontroˆle´esne´cessited’autresmode´lisationsetdiffe´rentesge´ne´ralisationsdumode`ledeCoxonte´te´e´tudie´es.Unehe´te´roge´ne´ite´peutprovenirdel’existencedevariablesnonobserve´es,individuellesoucommunesa`plusieursindividus.Lade´pendanceainsicre´e´eentrelesindividuspeuteˆtremode´lise´edeplusieursmanie`res.Unehe´te´roge´ne´ite´peuteˆtretemporelle,avecunee´volutionquivarieselonplusieurse´chellesdetemps.Leshypothe`sesdumode`lepeuventn’eˆtrevalablesquelocalement,avecparexempledesmodificationsselondesruptures.Surcethe`medesdure´esdesurvie,l’e´quipeadese´changestre`ssuivisavecd’autreslabora-toiresquitravaillentdanslemeˆmedomaine,enparticulierl’Unite´INSERM472a`Villejuif,quiappartiente´galementa`l’IFR69etquiestdirige´eparThierryMoreau,re´pute´poursestravauxensurvie.Descollaborationsetdesgroupesdetravailsesontconstitue´s.Plusre´cemment,deslienssesonte´tablisavecd’autrese´quipesquisesonttourne´esverscedomaineetversceluidelafiabilite´:cellesdeBordeaux2,del’IUPdeVannesetdel’UTCdeCompie`gne.OnpeutremarquerqueD.Cox,l’undespre´curseurslesplusce´le`bresdanslese´tudesdesurvie,avaitcommence´pardese´tudesdefiabilite´eninge´nierie.Aussiest-ilinte´ressantdeconfronterlestechniquesemploye´espourl’analysededonne´esdesurvieproprementditesa`cellesutilise´esenfiabilite´.Celaconduita`desapportsfructueuxdanslesdeuxdirections.Parexemple,qu’ils’agissedesurvieoudefiabilite´,pourselibe´rerdel’hypothe`setroprestrictivedeprocessusdeMarkov,onestamene´a`conside´rerdesmode`lessemi-markoviens.Cesderniersdonnentenparticulierunerepre´sentationplusre´alistedudevenirdespatientsencoursdetraitement(N.Heutte,1999).Danscetteperspective,nousavonsorganise´plusieursrencontresnationalesetinternationalessurlasurvieetlafiabilite´,unse´minairecommuna`cesquatreuniversite´s,dontl’unedesmanifestationslesplusmarquantesaeulieuautourdel’invitationa`BordeauxdeD.Coxen1999,uncolloqueinternational“Goodness-of-fitTestsandValidityofModels”a`Paris5,les29–31mai2000,lasecondeconfe´renceinternationalesurles“Me´thodesMathe´matiquesenFiabilite´”a`Bordeaux2,les4–7juillet2000.Outrecesliensavecdese´quipesvoisines,nousavonsdescollaborationssuiviesavecdesperson-nalite´sd’universite´se´trange`res,commeS.Gross,del’Universite´deNewYork,H.Arazozadel’Universite´deLaHavanea`Cuba,P.Halldel’Universite´deCanberra,I.Vonta,del’Universite´deNicosiea`ChypreetB.McGibbondel’Universite´deMontre´alauCanada.Lesthe`mesdecetaxederecherchesontde´taille´sci-dessous.1.1Priseencomptededonne´esmanquantesL’observationdevariablespeutmanquerchezcertainsindividus.Danslecasou`unecovariableestobserve´avecdesdonne´esmanquantesinde´pendammentdelavaleurdecettecovariable,desme´thodesade´quatesonte´te´propose´es.Lede´veloppementdetellesme´thodespourlemode`ledeCoxetleurmiseenoeuvresurdesdonne´esme´dicalesserapoursuiviauseindel’e´quipeparO..snoPD’autrepart,dansunmode`lemulti-e´tats,ilarriveaussiassezsouventquelesinstantsdetransitionentredeuxe´tats,nesoientconnusqu’approximativement.O.Pons,C.HuberetN.Heuttecomptenttraitercecasdedonne´esincomple`tementobserve´es.Uneapplicationa`desdonne´esdequalite´deviesoustraitementsanti-cance´reuxestenvisage´e.O.Pons,(2000).EstimationintheCoxmodelwithmissingcovariatedata.Pre´publicationduse´minairedeParis5.3
1.2Inclusiondelade´pendancedanslamode´lisationdessurviesmultidimen-sionnellesaveccensurepardesmode`leshie´rarchiquesd’interactionDesdure´esdesurviecorre´le´essurviennentdansbeaucoupdecirconstances.D’unepart,dansl’expe´rimentationanimale,lorsquedestraitementssontapplique´sa`dessujetsissusd’unemeˆmeporte´epourplusieursporte´esdiffe´rentes,d’autrepart,enge´ne´tiquee´pide´miologique,lorsqu’ons’inte´resseauxdure´esdesurviedejumeaux,etenfindanslesessaisthe´rapeutiques,quandplusieursdure´essontmesure´eschezlemeˆmesujet.C.HuberetS.Grossontre´cemmentde´veloppe´unenouvellefamilledemode`les,apparente´sa`lare´gressionlogistique,pourdesdure´esdesurviediscre`tesetgroupe´espre´sentantunede´pendance.S.GrossetC.Huber,(2000).HierarchicalDependencyModelsforMultivariateSurvivaldatawithCensoring.LifeDataAnalysis(LIDA),6,299-320.L’extensiondecemode`lea`desdure´escontinuesseralaprochainee´tapedecetravail.S.GrossetC.Hubercomptentensuitecomparerleurapprocheparunmode`lehie´rarchiquea`cellequiconsistea`introduiredanslemode`leunfacteurmultiplicatifale´atoire,ditla”frailty”(fragilite´)etcellequiconsistea`travailleravecles”workingequations”:S.GrossetC.Huberproposentd’examinerlesrelationsqu’ilpourraityavoirentreleurmode`leetl’approchedePrenticeetHsufonde´esurles”workingequations”,a`lafoisd’unpointdevuethe´oriqueetgraˆcea`dessimulations.Toujoursa`lafoissurleplanthe´oriqueeta`l’aidedesimulations,S.GrossetC.Huberproposentdecomparerlaversioncontinuedeleurmode`leaveclaversioncorrespondantedesmode`lesdefragilite´ayantlesmeˆmesdistributionsmarginales.Ellescomptentfinalementappliquerlesre´sultatsdecettee´tudeme´thodologiquea`uneenqueˆtedesante´publiquesurlasurvenuedemaladiescardio-vasculaires,desdonne´essurdesjumeauxetdesdure´esd’implantsauxquellesellesontacce`s,enutilisantlaversiondiscre`teetlaversioncontinuedumode`le.C.Huber,(2000).CensoredandTruncatedLifetimeData.in”RecentAdvancesinReliabilityTheory”,N.Limnios,M.Nikulined.,Birkhaser(pp291-300).1.3Priseencomptedediverstypesd’he´te´roge´ne´ite´a.He´te´roge´ne´ite´duea`desme´langes:Unehe´te´roge´ne´ite´peutprovenirdel’existencedevariablesindividuellesnonobserve´esquiconduisenta`desmode`lesdeme´langesdelois.Lorsqu’unepopulationeststructure´eenkgroupesetquel’appartenanced’unindividua`ungroupeestinconnue,onobtientainsiunme´langesdeklois.L’e´tudeducomportementdelastatistiquedurapportdevraisemblancepourdeshypothe`sessurlenombredecomposantesd’untelme´langeestdifficile.Nousavonse´tudie´ceproble`medansplusieursmode`les,avecetsanscensuredesobservations;unmode`ledeme´langesae´te´utilise´pourl’analysededure´esentrelesoccurrencesd’unemaladiesousdesconditionsdesusceptibilite´variablesetenpre´sencedecovariablesindividuelles.M.LemdaniandO.Pons,(1997).Estimationandtestinfinitemixturemodelsforcensoredsurvivaldata.Statistics,29,pp363-388,M.LemdaniandO.Pons,(1999).Likelihoodratiotestsincontaminationmodels.Bernoulli,5,pp705–719,P.Gasqui,O.PonsandJ.-B.Coulon(2000).Anindividualmodellingtoolforconsecutiveclinicalmastitisduringthesamelactationindairycows:amethodbasedonasurvivalmodel,VeterinaryResearch.b.De´tectionderupturesdansdesmode`lesdeCoxLemode`ledeCoxpeutcomporterplusieursphasessuccessives,lespointsderupturepouvantavoirlieusoitdansletempssoitdansunecovariable.O.Ponsade´veloppe´desme´thodespourtraitercesdeuxcaslorsqu’uneruptureseproduitdanslare´gressiondumode`leendespointinconnusetelleae´tudie´lesproprie´te´sasymptotiquesdesestimateurs.4
O.Pons(1999).EstimationinaCoxregressionmodelwithachange-pointatanunknowntime,expose´ause´minaired’Orsay,ParisXI,etsoumispourpublication,O.Pons(1999).EstimationinaCoxregressionmodelwithachange-pointaccordingtoathresholdinacovariate,soumispourpublication.c.Priseencomptedelamultiplicite´dese´chellesdetemps:Unehe´te´roge´ne´ite´peuteˆtretemporelle,l’e´volutionde´pendantdeplusieurse´chellesdetemps,tellesqueladure´edepuisl’entre´edansunstaded’e´volutionetl’aˆge.Cettede´pendancepeutapparaıˆtrea`lafoisdanslerisquedebaseλX|S(x;S)deladure´eXdansune´tatconditionnellementa`ladated’entre´eSdanscete´tatetdanslescovariablesdansunmode`ledeCoxdelaformeλX|S,Z(x|S,Z)=λX|S(x;S)eβTZ(S+x).O.Ponsaconstruitunestimateurdelafonctionderisquedebasecumule´eetducoefficientdere´gressionetae´tudie´leurcomportementasymptotiquea`l’aidedeprojectionsdeU-statistiques.Dessimulationsmontrequel’omissiondelanonstationnarite´entraıˆnedesbiaisquipeuventeˆtreimportants.O.Pons,andM.Visser,(2000).Anon-stationaryCoxmodel.Scand.J.Statist.27,619–639.d.Variabilite´descoefficientsdelare´gressiondeCoxenfonctiondescovariables:Lescoefficientsdumode`ledeCox,quisonta`l’origineconstantsontde´ja`e´te´ge´ne´ralise´saucasdefonctionsquide´pendentdutempsoud’unecovariable,e´trange`rea`cellesdumode`leetdesestimateursfonde´ssurdessplinesavaiente´te´propose´s.Cependant,leurcomportementn’avaitpase´te´e´tudie´.O.Ponsproposed’autresestimateursdesparame`tresd’unmode`leavecde´pendancea`unecovariableetae´tudie´leurloiasymptotique.O.Pons,(1999).Nonparametricestimationinavarying-coefficientCoxmodel,Math.Meth.Statist.(accepte´eta`paraıˆtre).1.4Techniquesdere´e´chantillonnage(bootstrap)pourlesdure´escensure´esAlasuited’Efronqui,lepremier,en1981(JASA)aintroduitlestechniquesdere´e´chantillonnagepourdesdure´escensure´esinde´pendantes,GrossetLai(StatisticaSinica,1996)ontaborde´plusieurstypesdeme´thodesbootstrap,enparticulierlebootstrap”simple”etlebootstrap”e´vident”pourdesdure´escensure´esettronque´es.S.GrossetC.Huberproposentd’utilisercestechniquespourdesestimationsparintervallesdesparame`tresdelare´gressionpourlesversionsdiscre`teetcontinuedeleurmode`ledede´pendance.Ellespourrontalorscomparerlesintervallesdeconfianceobtenusparlebootstrapsimple,parlebootstrape´vident,etlesintervallesdeconfiancefonde´ssurl’approximationnormaledesloisdesparame`tresdelare´gression.Ellescomptentaussiappliquerlame´thodedeLaietWang(StatisticaSinica,1993)fonde´esurlesU-statistiquespoure´tablirlavalidite´asymptotiquedubootstrapsimple,toutaumoinsdanslecasdiscretetdanscertainscasparticuliersdumode`lecontinu.Gross,S.T.andLai,T.L.(1996).”BootstrapMethodsforTruncatedandCensoreddata”.StatisticaSinica,Vol6,3,509-530.1.5Mode`lesdefragilite´(frailty)Lesmode`lesdede´pendancequiutilisentlafragilite´onte´te´e´tudie´sdanslecasou`descensuresdroitessontpre´sentes,maispaslorsquelesdonne´essontsujettesaussia`descensuresd’unautretypeoua`destroncatures.C.HuberetI.Vontaproposentdege´ne´raliserl’e´tudedecesmode`lesaucasdecensuresettroncaturesquelconques.5
1.6Testsse´quentielspourdesdure´esdesurvieaveccensureUnenouvelleapprochese´quentiellebaye´siennedelacomparaisondedure´esdesurviedanslesessaisthe´rapeutiquesestpropose´eparY.deRycke.Elleestmotive´eparlesessaismene´sa`l’InstitutCuriesurdestraitementsdecancerdusein.Fonde´esurlesintervallesdecre´dibilite´,cetteme´thodepermetd’arreˆterl’essaide`squ’ilestconcluantcomptetenudesobjectifsqu’ons’estfixe´,sansattendrequeletraditionnelnombredesujetsne´cessairesa`l’e´tudeaite´te´atteint.Celapeutconstituerungainappre´ciabledanscertainscas,enparticulierd’unpointdevue´ethique.1.7Mode´lisationsemi-markoviennededure´esdesurvieN.Heuttede´veloppeunmode`lesemi-markovienpourlesdure´esdevieaveccensure.Cemode`lepermetenparticulierunerepre´sentationre´alisteduprocessusvitald’unmaladeencoursdetraitementquipassepardiverse´tatsetyse´journependantdesdure´esquipeuventounonde´pendredefacteursendoge`nes(dosagesbiologiques,traitsge´ne´tiques,...)ouexoge`nes(traite-ment,environnement,...).Ils’agitdetesterlapre´sencedetelseffetset,danslecasou`elleestprouve´e,d’e´valuerleurimportance.1.8Me´thodesnon-parame´triquesensurvie:estimationdutauxdehasardetre´gressionC.HuberetB.Mac-Gibbonontconside´re´leproble`medel’estimationnonparame´triquedutauxdehasardpourdesdure´esdevieenpre´sencedecensure.Ellesontobtenu,pardesme´thodesquisontdansleprolongementdecellesdel’articledeC.Huber(”Lowerboundsforfunctionestimation”.SpringerVerlag,1997)desbornespourlerisquequadratiqueminimaxquandonestimeuntauxdehasardenpre´sencedecensure.S.Gross,andT.Lai,(1996).”NonparametricEstimationandregressionAnalysiswithLeftTruncatedandRightCensoredData”.JournaloftheAmericanStatisticalAssociation,Vol91,435,1166-,0811C.HuberandB.McGibbon”Lowerboundsforestimatingahazard”,articlesoumis.2Mode`lesMarkoviens:2.1Mode`ledeMarkovCache´C.Guihenneuc-Jouyaux,encollaborationavecS.Richardson,DRa`l’INSERMU170,atravaille´surdesMode`lesdeMarkovavecerreursdemesure:approchebaye´sienneetapplicationa`l’e´tudelongitudinaledusuividelymphocytesT4.Lamode´lisationdel’histoirenaturelledel’infectionparVIHparunprocessusdeMarkoventempscontinujoueunroˆleimportantdanslese´tudesactuelles.Lesmode`lessupposentquel’e´volutiondupatientpeuteˆtrecaracte´rise´eparuncertainnombredestadesdegravite´.Lestauxdetransitionentrelesstadespeuventeˆtrefacilementestime´squandlaclassificationd’unpatientdansunstadedegravite´discretsefaitsansambigute´.Mais,cetteclassificationestsou-ventfonde´esurladiscre´tisationd’unevariable”marqueur”continuequiexhibedesfluctuationsimportantes(pouvantprovenirdefluctuationsindividuellesa`courtterme,d’erreursdelabora-toire).Ainsi,laclassificationdansunstadeestsujettea`uneerreurdemesureamenanta`desestimationsincorrectesdestauxdetransition.Cetteconstatationame`nea`formulerunmode`lebaye´sienhie´rarchiquepourleprocessusdelamaladie(processusdeMarkovsurdese´tatscache´s)etleprocessusdemesure(lienentrelesobservationsetlese´tatscache´s)permettantdefaireconjointementlesestimationsdesparame`tresdecesdeuxprocessus.Afind’estimerl’ensembledetouslesparame`tresa`partirdeleurdistributionaposteriori,uneme´thodedeMonteCarloparchaıˆnedeMarkovimplante´eviaunalgorithmestochastique(e´chantillonneurdeGibbs)estmiseenoeuvre(Gilsk,RichardsonetSpiegelhalter(1995)).Ilestainsipossibledesimulerla6
distributionconjointeaposteriorides”parame`tres”(parame`tresstatistiquesetstadescache´s)desdeuxprocessus.Cetteapprocheestapplique´ea`lamode´lisationdusuividepatientsse´ro-positifsdedeuxe´tudes:lacohortedeSanFranciscoquire´unitenviron3800tempsdesuivide430patientsde1984a`1992etl’essaiConcordecontenantenviron23000tempsdesuivide1641patientsde1988a`1995.Cetravailadonne´lieua`deuxpublications(GuihenneucetRichardson,2000etGuihenneucetal.,2000)eta`plusieursconfe´rences.C.Guihenneuc-Jouyaux,S.Richardson(2000).Mode`lesdeMarkovavecerreursdemesure:Ap-prochebaye´sienneetapplicationa`l’e´tudelongitudinaledusuivideslymphocytesT4.Biome´trieetMe´thodesBaye´siennes,SFB,n14C.Guihenneuc-Jouyaux,S.Richardson,I.M.Longini(2000).ModellingmarkersofdiseaseprogressionbyahiddenMarkovprocess:applicationtocharacterisingCD4celldecline.Biometrics,V.56,733–741.2.2Mode´lisationMarkoviennediscre`teetcontinueUnsecondtravailae´te´de´bute´aucoursd’unstagedeDEAetsepoursuitactuellementdanslecadredelathe`sedeYoannMadecco-encadre´eparC.Guihenneuc,V.LasserreetS.Richardson(INSERMU170).Lemarqueurestunevariablea`supportcontinuetilsembleraitplusnatureld’utiliserunmode`lestochastiquea`espaced’e´tatscontinupourenmode´liserl’e´volution.Maiscetypedemode`lene´cessitelaconnaissancedeladated’infection,quiestrarementconnuedanslese´tudescliniquesoue´pide´miologiquessurlespatientsVIHpositifs.Cecienlimitel’application.L’objectifdecettethe`seestdouble:–proposerunmode`lea`espaced’e´tatscontinuavecdated’infectioninconnue–etcomparercesdiffe´rentesapproches(continuesetdiscre`tes)surlabasedeleurcapacite´depre´dictiona`courtetlongtermeetdesestimationsdestempsdepassage.Unege´ne´ralisationdecetravailestfaiteeninte´grantunee´ventuellerupturedanslatrajectoiredespatients.Cettepartieadonne´lieua`unarticlesoumis.Y.MadecetC.Guihenneuc-Jouyaux(2000).ComparisonofcontinuousanddiscreteMarkovmodelsforlongitudinaldata:Applicationtothefollow-upofCD4count,soumis.2.3AlgorithmesstochastiquesdetypeMontecarloparChainedeMarkov.EncollaborationavecC.P.Robert(CREST,INSEE,Paris)Cettepartieconcernel’e´tudeducontroˆledeconvergencedesalgorithmesstochastiquespardiscre´tisationdechaıˆnesdeMarkov(MCMC).L’utilisationdesalgorithmesstochastiquesMCMCdanslesmode`lesbaye´siensestdeplusenplusfre´quentemaisposeunproble`medede´tectiondeconvergence.Unepremie`ree´tudeconsistea`e´tudiercesproble`mesdeconvergencedanslecasou`lesparame`tressimule´sparl’algorithmeMCMCsonta`supportcontinu.Beaucoupdere´sultatsexistentsurlesproble`mesdeconvergencedeschaıˆnesdeMarkovquandl’espaced’e´tatsestdis-cret.Or,ilestbiensuˆrtre`sfre´quentquelesupportd’unparame`tresoitcontinu.C.GuihenneucetC.Robertmontrentcommentlathe´oriedurenouvellementpermetdecre´erunechaıˆnedeMarkovdiscre`tea`partird’unechaıˆnedeMarkova`espaced’e´tatscontinu.Lame´thoderetenueconsistea`sous-e´chantillonnerunediscre´tisationdelachaıˆnecontinueendestempsderenou-vellement.UnefoislachaıˆnedeMarkovdiscre`teainsiobtenue,diversre´sultatsdeconvergencepeuventeˆtreutilise´s.Lanotiondedivergencede´veloppe´eparKemenyetSnell(1960)estchoisiedanscettee´tude.L’outildecontroˆledelaconvergencequis’ende´duitestd’aborde´value´surdeschaıˆnesenparalle`leavecdiverstempsd’arreˆt,puissurunseulcoupledechaıˆnes,graˆceauthe´ore`medeBirkhoff.Cetravailadonne´lieua`unarticledansJASA(GuihenneucetRobert,1998)eta`unepre´sentationa`RebildauDanemarkenMai1996au”FirstEuropeanConferenceonHighlyStructuredStochasticSystems”.Unesecondee´tudemene´eparC.GuihenneucetJ.Rousseauestencoursetaundoubleobjectif:–fairelacomparaisonentrediffe´rentsalgorithmes(HastingsMetropolis,diffusiondeLangevin)danslecasdeparame`tremultidimensionnel–ame´liorationdelaconvergence7
desalgorithmesMCMCviaGibbssamplingdanslecasdesmode`lesdeMarkovcache´parl’inte´grationd’approximationsdeLaplacepermettantlare´ductiondunombredeparame`tresdanslese´chantillonneursdeGibbs.Cetravailae´te´pre´sente´lorsdelaconfe´renceSecondEuropeanConferenceonHighlyStructuredStochasticSystems”,enItalieetdelaconfe´rence”FirstEuropeanConferenceonSpatialandComputationalStatistics”enGrandeBretagne.Unarticleestencoursdere´daction.Cese´tudess’inte`grentplusge´ne´ralementaugroupedetravailorganise´auCREST(INSEE)parC.Robertsurlethe`me”controledesalgorithmesMCMC”quiadonne´lieua`unLectureNoteintitule´”DiscretizationandMCMCConvergenceAssessment”,Roberted,SpringerVerlagen1998ou`C.Guihenneucaparticipe´a`deuxchapitres.K.L.Mengersen,C.P.Robert,C.Guihenneuc-Jouyaux(1998).MCMCConvergenceDiagnostics:aReview.ProceedingsofthesixthValenciaInternationalMeetingonBayesianStatistics.C.Guihenneuc-Jouyaux,C.P.Robert(1998)ValidDiscretizationviaRenewalTheory,LectureNote”DiscretizationandMCMCConvergenceAssessment”.Roberted,SpringerVerlag.C.Guihenneuc-Jouyaux,C.P.Robert(1998).FiniteMarkovchainconvergenceresultsandMCMCconvergenceassessment.J.Am.Statis.Ass.93,1055-1067.C.Guihenneuc-Jouyaux,S.Knight,K.L.Mengersen,S.RichardsonandC.P.Robert(2000).MCMCConvergenceDiagnosticsinAction,enre´visiona`J.Am.Statis.Ass.2.4Analysedesse´quencesd’ADNL’objectifconsistea`de´criredesmode`lesstatistiquescapablesd’expliqueraumieuxl’he´te´roge´ne´ite´desse´quencesettenterd’identifierlesre´gionsdistinctesduge´nome,susceptiblesdere´ve´lerdesdiffe´rencesdefonctionoudestructure.Letravails’organiseautourdetroisgrandsaxes,statis-tique,biologiqueetinformatique;ils’effectueauseind’ungroupecompose´demembresduLaboratoireMathe´matiqueetge´nomedelUniversite´dE´vry,duLaboratoireMathe´matique,Informatiqueetge´nome”del’INRA,del’InstitutNationalAgronomiqueParisGrignonetduLaboratoired’AnalyseetMode`lesStochastiquesdel’Universite´deRouen.Depuisquelquesanne´es,auseinduLaboratoiredeStatistiqueMe´dicaledeParis5,untravailae´te´poursuiviparF.Muri(MCa`Paris5),quiutiliseunmode`le,expliquantaumieuxl’he´te´roge´ne´ite´observe´e,pourde´limiterlesre´gionshomoge`nesdelase´quenced’ADNe´tudie´e.Letravaildethe`sed’O.The´baudconsistea`e´tablirlathe´oriemathe´matiqueetstatistiquequipermettradefairee´voluercontinuementlachaıˆnedeMarkovutilise´edanscettemode´lisation.OnparledechaıˆnesdeMarkovde´rivantes.Apre`suntravaildesimulationsenCetC++,afind’appre´henderlecomportementdeschaıˆnessuivantlaformeetlacompositiondesmode`les,sesrecherchessesontoriente´esdansdeuxdirections:lapremie`reencoupantlesse´quencesenfeneˆtresdetaillesfixe´esetenconside´rantlavariableN=Nab[u,u0]Na[u,u0]quiestimelaprobabilite´d’avoirunasuivid’unbsurl’intervalle[u,u0],soitl’unedestransitionsdelamatricedetransitiondelachaıˆnedeMarkovde´rivante.Ensuite,parlebiaisd’unere´gressionline´aire,onpeutre´cupe´rerdesestimationsdesmatricesquiconstituentlemode`le.Laphasesuivanteestdecalculerl’espe´ranceetlavariancedecettevariableafindesavoircommentcesdeuxstatistiquesde´pendentdel’intervalleservantaucalcul,cequiestne´cessairepourlare´gression.LeurestimationutiliselaDelta-Me´thode.Sontravailsecomple`teparunepartiebeaucoupplusapplique´edesimulationsetd’analysedesre´sultatsobtenus,aussibiend’unpointdevuebiologique,avecdesbiologistesdel’INRA,questatistiqueauseindugroupege´nomeoulacomparaisondesesre´sultatsaveclestravauxde´ja`effectue´sdanscegroupeavecleschaıˆnesdeMarkovcache´esauragrandinte´reˆt.Enfinunobjectifestdemettrea`ladispositiondesbiologistesdesoutilsinformatiquesquiviendrontcomple´terceuxde´ja`disponiblesetcre´e´spardesmembresdugroupege´nome.8
3Mode´lisationde´terministeetstochastiquedese´pide´miesd’unepopulationa`deux-types:applicationa`l’e´pide´mieduSidaa`abuCLamode´lisationdese´pide´miesd’unepopulationa`deuxtypessefaita`l’aidedeprocessusmarkoviensdetypenaissanceetmort.Soit(X(t),Y(t),t0)unprocessusdenaissanceetmortdetypeline´airea`tauxde´pendantdutemps,ou`X(t)(respY(t))repre´sentea`l’instantt,latailledelapopulationdetype1(resptype2).Onsupposedeplusqueletauxdenais-sancedanslapopulationdetype2de´penduniquementdelatailledelapopulationdetype1.Soientλ(t)p,µ(t)(t)(respλ(t)q,µ0(t)(t))respectivementlestauxdenaissance,demortetd’immigrationd’unindividudetype1(respdetype2),ou`prepre´senteletype-ratio(type1surtype2)(p+q=1).Sil’onadjointauprocessusbivarie´leprocessusale´atoireZ(t)quicomptesur[0,t]lese´ve´nementsdetypenaissanceetsiΨ(u,v,w,t)repre´sentelafonctionge´ne´ratricedesprobabilite´sdelaloijointede(X(t),Y(t),Z(t))conditionnellementa`X(0)=m,Y(0)=0etZ(0)=m,alorsΨ(u,v,w,t)ve´rifieunee´quationdiffe´rentielleauxde´rive´espartiellequi,danslecasou`lestauxsontconstantsparrapportautemps,estfonctiondeΦ(u,v,w,t)fonc-tionge´ne´ratriceduprocessus(X(t),Y(t),Z(t))sansimmigration.Ainsinousde´duisonslesloismarginalesduprocessusainsiquelecomportementlimitedecesmarginales.LepremiercasdeSIDAa`Cubaae´te´diagnostique´en1986.Depuiscettedate,unsyste`mederepe´ragedesse´ropositifsae´te´misenplaceenincluantlarechercheactivedespartenairessexuelsdesse´ropositifsconnus(contacttracing).L’objectifdanscecasestd’estimerlatailledel’e´pide´miedeVIH(connusetinconnusdusyste`medesante´cubain)enutilisantdesmode`lesa`compartimentscecitantd’unpointdevuede´terministequestochastique(H.Arazoza&R.Lounes)etdesme´thodesd’analysedesurvieetdere´tro-calcul(H.Arazoza&T.Hoang&R.Lounes).1.utilisationdesmode`lesa`compartiments:L’objectifestd’estimerlatailledel’e´pide´miedeVIH(connusetinconnusdusyste`medesante´cubain)enutilisantdesmode`lesde´terministesetstochastiquesa`compartiments.H.Arazoza,PRa`l’Universite´delaHavane,etR.Lounesontutilise´unevariantedutypedemode`lepre´ce´dent,ou`lese´quationsdumode`lesontle´ge`rementdiffe´rentesmaisconduisenta`unere´solutiondel’e´quationauxde´rive´espartiellesanaloguea`cellede´criteplushaut.Danscemode`le,lesse´ropositifsetlesside´ensinconnusduprogrammedesante´publicsontconside´re´scommedesimmigrationsdontlestauxsonta`estimer.E´tantdonne´eslesconditionsinitiales(t=0pour1985,m=1)etlesestimationsdestauxdenaissanceetdemortdesdeuxtypes(base´essurlape´riode1985-1994),ilsontpuestimerlestauxassocie´sauxse´ropositifsetside´ensinconnusduprogrammea`l’aidedese´quationsmoyennes(espe´rancesdesprocessusmarginaux).Lemode`leleuraainsipermisd’estimerlenombredes‘e´ropositifsetdeside´enscontamine´suniquementparvoiesexuelle,connusduprogrammepourl’anne´e1995.Unee´tudedumode`lede´terministesous-jacentetunecomparaisonaveclemode`lestochastiquecomple`tentl’e´tude.Unprolongementdecetravailestl’e´tudede´terministed’unmode`lenonline´airetenantcomptedelarechercheactive(contacttracing).Ladynamiquesefaitentroiscomparti-ments:lesse´ropositifsinconnusduprogrammedesante´cubain,lesse´ropositifconnusduprogramme,etlesside´ensconnusduprogramme.Enraisond’interactionsnonlin´eairesentrecesdiffe´rentscompartiments,l’e´tudedumode`led’unpointdevuestochastiqueestintraitableetseulele´tudede´terministeae´te´envisage´e.Danscetravail,lese´quilibresdontl’unestdit”e´quilibred’absenced’e´pide´mie”etl’autre”e´quilibreende´mique”sontde´termine´setleurscomportementasymptotiquementlocaletglobaleste´tudie´.Unajuste-mentauxdonne´escubainesestfaitenvued’e´stimerlesparame`trespertinentsdumode`le.2.AnalysedesurvieetRetro-calcul:9
L’analyseutiliseaussibienlesme´thodesstatistiquesquemathe´matiques.Letempsd’incubationetletauxdesurviesontestime´sstatistiquementenuitlisantlame´thodedeKaplanMeier.Letauxd’infectionparleVIHestcalcule´parretro-calcul.Lesre´sultatsobtenusa`l’aidedesmode`lesdynamiquesdonnentdesestimationsdel’e´volutionfuturedutauxd’infectionparleVIHetsontconsistantsavecceuxobtenusa`l’aideduretro-calcul.R.LounesetH.DeArazoza,(1999).Atwo-typemodelfortheCubannationalprogramonHIV/AIDS.IMA.J.Math.Appl.Med.Biol.16,143-154.H.DeArazozaetR.Lounes,T.Hoang,Y.Interian.ModelingHIVEpidemicUnderContactTracing–TheCubanCase.JournalofTheoriticalMedicine,accepte´eta`paraıˆtre.H.DeArazozaetR.Lounes,(1998).PredictionsfortheCubanHIV-AIDSepidemic.H.DeArazozaetR.Lounes,(1999).Anonlinearmodelforasexuallytransmitteddiseasewithcontacttracing.Soumisa`publicationH.DeArazoza,R.Lounes,T.HoangetJ.Perez.PredictionsfortheCubanHIV-AIDSepidemic.4Variationsge´ographiques.V.LasserreetC.Guihenneuconttravaille´surlavariabilite´ge´ographiqueene´pide´miologieencollaborationavecS.Richardson(INSERMU170).4.1Biaisdese´tudesdecorre´lationse´cologiquesNotree´tudeme´thodologiquesesituedansuneproble´matiqued’interpre´tationdese´tudesdedonne´es,nonpasindividuellesmaisagre´ge´es,appele´ese´tudese´cologiques.Leslimitationsdecese´tudese´cologiquesonte´te´discute´esdemanie`reessentiellementqualitativepardenombreuxauteurscarellessontsujettesa`diffe´rentstypesdebiais,enparticulierlebiaisdite´cologiquequiserapportea`ladiffe´renceentrelesestimationsdesrelationsdose-effetauniveauindividueletauniveauagre´ge´.Commeladifficulte´estd’inte´grerauniveaudel’agre´gatdesrelationsmulti-varie´esnonline´aires(mode`lesmultiplicatifsdetypeexponentiel),ilestne´cessairedeconnaıˆtreladistributionconjointedesfacteursderisqueintraunite´sge´ographiques.Or,cettedistributionestge´ne´ralementinconnue.Nousavonsde´veloppe´lecasou`lesfacteursderisqued’expositiond’unemaladiesontdichotomiques,(Lasserreetal,2000).Lorsdedonne´esagre´ge´es,lespre´valencesmarginalesd’expositionpourchaqueunite´ge´ographiqueisontdisponiblesmaislapre´valencedel’expositionconjointeestaprioriinconnue.Letauxd’incidencedelamaladiepourl’unite´ge´ographiqueie´tantfonctiondecettepre´valenceconjointe,lesrisquessontdoncinaccessiblesdemanie`rege´n´erale.Unepremie`reapprocheafindecontournercettedifficulte´estdesupposerquelerisqued’expositionconjointeestdetypeadditif,maiscemode`lederisqueesttre`scontraignantetpeureconnuene´pim´emiologie.Unesecondeapprocheplusre´alisteestdesupposerquelerisqued’expositionconjointeestdetypemultiplicatif.Afinderendrelemode`leestimable,ilestalorsne´cessairedesupposer,deplus,l’inde´pendancedeladistributionconjointedesfacteursderisqueintraunite´sge´ographiques.Sil’hypothe`sed’inde´pendancedeladistributionconjointen’estpasve´rifie´e,onpeutne´anmoinspensera`encoreproposerlemode`lederisquede“typemutiplicatif”bienquecelaentraıˆneunemauvaisespe´cificationdemode`le.Unee´tudebase´esurdessimulationsnousapermisd’e´tudierlesconse´quencesdirectesd’unemauvaisespe´cificationdecerisqueconjoint,dechiffrerlebiaisdanslesestimationsetd’ende´duireunepolitiquedumoindremalafind’obteniruneame´liorationdubiaisquelquesoitlevraimode`lesous-jacentdel’expositionconjointe.Cettere´flexionestillustre´eparunexempled’estimationdurisquedelamortalite´parcancerdupoumonenFranceassocie´ea`deuxfacteursderisque:expositionsindustrielleeturbaine,l’unite´ge´ographiquee´tantlede´partementfranc¸ais.01
Notreobjectifestd’e´tendrenosre´flexionsaucasou`lesfacteursderisquesontcontinus.Notrenouvellede´marcheconsistea`proposeruneapproximationdeladistributionconjointedesfacteursderisqueintraunite´,quiutiliseraitdiffe´rentstypesdere´sume´squantitatifsunivarie´squiseraientdisponibles(moyenne,variance,bornes...)danschaquezone.Cettede´marches’appuyerasuruneformulationduprobl`emed’aggre´gationdanslecadresdesprocessusponctuels(Cressie,1991).Lepremiercrite`requenousretiendronspourchoisiruneapproximationestceluidumaximumdentropie(CressieetRichardson,2000).Cecrite`repermetdespe´cierunedistributionposse´dantunmaximumdevariabilite´etquisatisfasseuncertainnombredecontraintessursamoyenne,variance,intervalledevariabilite´.Or,detellesinformationssontcellesquisonttypiquementdisponiblesdansdesenqueˆtesquis’inte´ressent,parexemple,a`l’expositiond’une´chantillondelapopulation.Notreapprochepermettradoncd’incorporercetyped’informationdanslese´tudesdevariationsge´ographiquesetainsi,decontribuera`diminuerlebiaise´cologique.Samiseenoeuvrene´cessiteratoutd’aborddede´velopperdesoutilsd’optimisationnume´riquesafind’obtenirladistributiondumaximumd’entropie.Dessimulationsserontensuitere´alise´esafind’e´valuerquantitativementl’ame´liorationdesestimationsdesrisquesquipeuteˆtreobtenueparcetteapproche.S.Richardson,C.Guihenneuc-Jouyaux,V.Lasserre(1996).Ecologicalstudies-biases,misconceptions,andcounter-examples.Am.J.Epidem.(Letter),143,522-523.V.Lasserre,C.Guillennec-Jouyaux,S.Richardson(2000)Biasesinecologicalstudies:utilityofinclud-ingwithin-areadistributionofcounfounders.Statist.inMedic.(toappear).4.2Mode`lesdere´gressionpourl’analysededonne´esirre´gulie`respre´sentantuneautocorre´lationspatialeC.Guihenneuc,V.LasserreetS.Richardson(INSERMU170)onttravaille´surcethe`mequiconcernelacomparaisondediffe´rentsmode`lesdere´gressionpourl’analysededonne´esirre´gulie`resquipre´sententuneautocorre´lationspatiale.L’objectificiestdeproposerunemode´lisationdelastructurespatialedesre´sidusdansunmode`ledere´gression.Eneet,lare´gressiondunprocessusspatial,indicateurd’unemaladie,enfonctiondevariablesexplicativesestutilise´eensante´publiqueetene´pide´miologie.Cesmode`lesdere´gressionposentunre´elproble`medechoixdelastructurespatialedesre´sidus.Deparlaprobableexistencedecorre´lationentrelesvaleursduprocessusdemaladiedansdeszonesvoisines,ilestpeure´alistedesupposerl’inde´pendancedesre´sidus.Deplus,dese´tudesontmontre´quesupposera`tortl’inde´pendancepouvaitavoirpourconse´quencedeconclurea`torta`l’existenced’uneliaisonentreleprocessusdelamaladieetlesvariablesd’exposition.Diffe´rentesmode´lisationsdel’autocorre´lationdesre´sidusexistentdanslalitte´rature.Cha-cuned’ellessupposeavoirdesconnaissancesapriorisurlesre´siduspermettantdefairesoitdeshypothe`sesdeformedede´croissancedel’autocorre´lation,soitdeshypothe`sesderelationsentrelesre´sidus“proches”.Lorsdel’e´tudedeRichardsonetal.(1992),nousavonsanalyse´plusieursstructuresspatialesdesre´sidusetdoncplusieursformesparame´triquesdematricesdecorre´lationquenousavonsensuiteapplique´danslecadredel’analysedestauxdemortalite´parcancerdupoumonetdesindustriesenFrance.Cesdiffe´rentesmode´lisationscorrespondentchacunea`desformesparticulie`resdede´croissancedel’autocorre´lationenfonctiondeladistance.Lechoixaprioridel’uneoul’autredecesformesestbiensouventimpossiblea`faireparunsimpleexamendesdonne´es.Nousavonsalorspropose´defairelesestimationssouscesdifferentsmode`lespuisdechoisiraposteriorisurlabasedecrite`resdecomparaisons.Chacunedecesmode´lisationsoffrel’avantageden’eˆtrede´pendantequed’unoudeuxparame`tressupple´mentairesrendantpossibleuneestimationparmaximumdevraisemblanceprofile´e,maisils’estre´ve´le´quelechoixdel’uneoul’autredecesmode´lisationsestsouventarbitrairecarlesdiverscrite`resdecomparaisonpeuventaboutira`desconclusionspeuclairesetparfoiscontradictoires.Enfin,unedernie`reapprochecettefois-cinonparame´triqueae´te´conside´re´esebasantsurl’estimationempiriquedechacundestermesdelamatricede11
Voir icon more
Alternate Text