Contraintes des architectures de calcul une opportunité pour développer les

icon

63

pages

icon

Français

icon

Documents

2009

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

63

pages

icon

Français

icon

Documents

2009

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Niveau: Supérieur

  • mémoire


,Contraintes des architectures de calcul : une opportunité pour développer les méthodes numériques D. Tromeur-Dervout Université de Lyon, Université Lyon 1 , CDCSP/ICJ-UMR5208-CNRS 9 Octobre 2009 JSO: Nouvelles Frontières pour la Simulation des Ecoulements : Algorithmes et Processeurs ONERA - Centre de Châtillon U. Lyon1, UMR5208 D. Tromeur-Dervout Contraintes des architectures de calcul : une opportunité pour développer les méthodes numériques 9 Octobre 2009 1/42

  • performance numérique

  • temps d'accés aux données

  • tromeur-dervout contraintes des architectures de calcul

  • réseaux lents

  • mémoire vive


Voir icon arrow

Publié par

Publié le

01 octobre 2009

Langue

Français

,no,1MU5R02D8T.orU.Lydsetniartihcraseer-DurmentCoutvoppronuoeétoputinresdectucul:ecalérumueiqhoétsndereppmselédruolev2
JSO: Nouvelles Frontières pour la Simulation des Ecoulements : Algorithmes et Processeurs ONERA - Centre de Châtillon
Contraintes des architectures de calcul : une opportunité pour développer les méthodes numériques
9 Octobre 2009
Université de Lyon, Université Lyon 1 , CDCSP/ICJ-UMR5208-CNRS dtromeur@cdcsp.univ-lyon1.fr
D. Tromeur-Dervout
2e00194/9scOotrb
omeuD.Tr5208,UMRrtiaCtnovruo-reDcttehircsadeesntenu:luclacedseruL.U1noy
Besoins denouvelles méthodologies de calculpouvantrelaxerles contraintes de communications sur des réseaux lents tout en étant précises et stables
1 2 Registres Cache
2-5 3-10
4 5 Sauv. Réseau disque 1E3 τ - 5E6 (ns)1E5 4E3 8E2 4E2 (MVOt--)32-32-8104-0/0 s E5 5E3 2E3 hiérarchies mémoires, latence et bande passante de communications. Le temps d’accésaux données est la principalecontrainte sur les performances. Le temps d’accés aux données est d’autant pluscritiqueen métacomputing.
3 Mémoire vive
80-400
pooptrnutipéuodrévelopperlesméthsedoémunuqirO9seobct20re2/09
Niveau Nom
42MethtionposiecomiaDnDemoallbSacmadomeTimpcodeinPnoitisoeleccaDOntheodsoAitkGridhcawneS-htdozremobprmaléqutiuceduclasidlbirtéurationofINBmethosdoCcnulisno,saL
émhtdoseunémiruqourdévelopperles
Solution Economique ? fédérer ponctuellementles ressources de calcul d’une entreprise multi-sites. Architectures d’aujourd’hui : constellation de systèmes beowulf sur le réseau internet avec des temps de latenceset desbandes passantes fluctuantes? Intérêt Scientifique Résoudre quelquesgrands challengesde calcul scientifique Retombéessur les performances des machines de type multi-clusters avec des hiérarchies de mémoires et de réseaux par l’amélioration des algorithmes.
249Oesobct20re3/09isitmoopDncemoiableDcalaSdshoetBmsiluncCoareleccaNIfonoitssertéretacoaumeoPruno,ssniuqioAiidentkch-SrzwaeMnodohttnosrGehdecompositionPODemhtdoiTemodamniing?mput:uneopportunitépettcruseedacclluaitresntsadehircuemoeD-ruovrnoCt,UMRyon1D.Tr5208UL.
leDomainScalabrieGitdAdshothonoititeMnoceDsopmecomaindedomdTimteohramzcSwhek-nthmeNBfInoioaterleccaDOPnoitisopsCodclonious,Ansgatnsinoneemperterformancenumériuqeeetfacicét//-Durmero.T8D20R5MU,1noyL.Uurpovedétuorténinu:lppoecedsuclaitecturesdesarchtnarnietreovtuoC0094bre2
Performance numérique: techniques de calculimplicites, avec desdépendancesde donnéesglobales, adaptatifs en temps et en espace. structuresde donnéesirrégulières pourlimiterla taille des systèmes Meilleure efficacité en calcul distribué (Travaux de Gustafson et al.) Poblème degrande taille utilisanttoute la mémoirevive structuresde donnéesrégulières avec desdépendancesde donnéeslocales.
/42leerpplodehoétsmqirémunsotcO9seu
taoionIfaDccleresitionPOndecomposnoi,onsCusclmeNBodthselrhtémsedoémunquri9Oesobct20re90/524
Une solution est d’introduire des décompositions de domaines/fonctions: localisation des données meilleurs temps d’accés Analyse mathématique pour : Déterminer un niveau de coupure des informations échangées Equilibrer la décomposition sur des critères numériques
sadeesntaitrontCacedserutcetihcrrtunoppo:unelculpoepvéleuodrtipé,UMR5208U.Lyon1-reDvruo.DrTmoueableScal-ncSwhrairAdtiekimedomaizmethodTpmoctisoamoDeDniondseGthnMiohoet
euqicO9srbot002e/496
Scalable Domain Decomposition Methods on Metacomputing
Schwarz DDM that is tolerant to high latences and low communication bandwidth based on the Aitken’s acceleration of convergence technique of. Time domain decomposition methods Time reversible schemes and DDM to break the time integration scheme sequentiality for ODE. A client-server approach to accelerate CFD problem POD to accelerate Newton
2alScéotDoapmrbuaéedleovcoplmpnpireeDlieosnmMéotshiotddessonnuemtéhro,lcsuoisnthodsConnofINBmeoitareleccaDOPnotisipoomecndaiommideohTdmztewhran-ScitkeridAtheGhcticeuterdscelacul:uneopportuniorT.ruemreD-tuovntCoinrasdteareson1,U.Ly208DUMR5
?rkdeknsaybnwolowteoDelbalaoceDniamioitosmpdshoetnMScomecsipoomedndailecctarenoitaDOPdAitken-ontheGriteohTdmicSwhramzaryptlencifeeusilsretupmoclellaodsCmethfINBionowootsnH,suoinolcoy1nUL.5208,UMRomeuD.TruovreD-riartnoCtsadeesntcttehircruseedacclluu:enopportunitépourdlevéepposelrhtémesodménuquri9Oes42
Metacomputing experiments framework
097/re20ctob
N. Barberou, M. Garbey, M. Hess, M. Resch, T. Rossi, J. Toivanen, D. Tromeur-Dervout, Efficient Metacomputing of Elliptic Linear
and Non-linear Problems,J. of Parallel and Distributed Computing, special issue on Grid computing, 63(5):564-577, 2003
snumhodesméterleolppédevopruinéttuorppeounl:cualcedserutcetihcraintesdesutContraruD-reovD8T.oremUM1,20R5U.onLy790024/
N. Barberou, M. Garbey, M. Hess, M. Resch, T. Rossi, J. Toivanen, D. Tromeur-Dervout, Efficient Metacomputing of Elliptic Linear and Non-linear Problems,J. of Parallel and Distributed Computing, special issue on Grid computing, 63(5):564-577, 2003
System configuration at Stuttgart, Pittsburgh, Helsinki, Julïch. Comp. #proc MHzτVcLocalization CrayS 512 450 12µs Stuttgart HLRS,320 MB/s CrayP 512 450 12µs PSC, Pittsburgh320 MB/s CrayH 512 375 12µs Helsinki CSC,320 MB/s CrayN 512 375 12µs320 MB/s , Julïch KFA
iqérs9uetoOce2brhoetBmINluncCodseleccaDOfonoitarntlyciellelpara,soHisnoesfetwuoslyaneowortwk?pmocretunilsbdekbllacaSisopmoceDniamoDeodsonthetionMethneS-hcawrGdiiAktmeTimadomerzodthtisoPnoiednipmoc
Efficient communication softwares are they sufficient to reach good performances?
Coupling of MPPs for one single application No change in source code No extensions to MPI Usage of vendor implemented fast MPI for internal communication Usage of standard protocols for external communication Implementation according to applications’ needs no limitation in problem size or machine size Practice of PACX-MPI On each machine two nodes have to be added
2002e4/89Ocs9brtoérumueiqtéohednsppreelmsurdévelotunitépoLyU.1,onR5UMl:cualecorppeountihcrasedserutceContvouttesdrainT.or02D8D-reemruodamniedhtdoiTemionPODaccompositfonomBNIelecitarlunconsihoetCodsDemoallbSactionposiecomainDdirGehtnosdohteMmerzwach-SentkAimmuns,CoionsicatratefowtxesiooslUSOBGLt:N,IOEG,LiPM-XCAP
a(x)xems(xyz(cbyy()seorrapaoltsrfvepcitlboreelbpillc(z)η>0,(y)>0,bσ,0>η0>(x,=f)uσIz+z)η)x(a3RΩ)z,y,hcawzremhtdoiTemdomaindecompositisopnoithteMosdohentidGrtkAi-Senisnocnul3CsD,sDProneolveebesofthcaDOPnoiitarelecBmINofonCodshoetmoceDniamoDelbalcaSensiyDimtrarArbiC.moS.icAIJMnoS.:15)877t.pu0(,2oH.9eodw6971991,Multilevsitwork?hccilausleihrera
Partial Solution Variant of Cyclic Reduction: AKA PSCR-Method (P.S. Vassilevski, 1984) Resembles closely the partial fraction variant of classical cyclic reduction by R.A. Sweet, 1988; T. Rossi and J. Toivanen.A Nonstandard Cyclic Reduction Method, its Variants and Stability.SIAM J. Matrix Anal.
Appl., 20(3):628–645, 1999. Parallel radix four version for 2D problems described in T. Rossi and J. Toivanen.Block Tridiagonal Systems with Separable Matrices ofA Parallel Fast Direct Solver for
4/20099munsedohtémselree2brtoOcs9ueiqéroepproutlauc:lnudéveloppnitépouretnisedsoCtuartnretuecsdcharecitemorT.D8ovreD-ruonLyU.e)20R5UM1,itnoosulinuqethcalleso-ctialdparhtiwrapsytiseht,hoetordfobprmsleitnofoavirbaelms(optimizedseparamsleobprcefaerntiehtrofseuqinhceenttfcieryeal,vepicsusemesorlbrapaepblOns.selyosecrevltnitafreactdirecodwithexirgnemhtsbrtcuut
Voir icon more
Alternate Text