On dit souvent que l'une des plus grandes satisfac tions des mathématiciens consiste établir desliens entre domaines a priori éloignés L'histoire récente du transport optimal de mesure est cet égard très représentative Initié la fin du XVIIIe siècle par Monge développé par Kantorovich au milieu du XXe siècle pour ses applications en économie ce sujet a connu une renaissance spectaculaire dans les der nières années partir des travaux de Brenier en méca nique des fluides Les spécialistes actuels peut être frap pés de délire monomaniaque voient maintenant du transport optimal partout depuis les équations semi géostrophiques en météorologie jusqu'aux problèmes isopérimétriques en passant par les milieux granulaires la physique statistique et les inégalités de Sobolev Essayons de retracer quelques étapes de cette renais sance Notons que conformément un phénomène assez courant Brenier a redécouvert certains résultats déjà connus mais que cette redécouverte loin d'être super flue a apporté un nouvel éclairage au domaine qui sans cela n'aurait certainement pas acquis sa notoriété actuelle

icon

6

pages

icon

Français

icon

Documents

Écrit par

Publié par

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

6

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Niveau: Elementaire

  • cours - matière potentielle : du temps


On dit souvent que l'une des plus grandes satisfac-tions des mathématiciens consiste à établir desliens entre domaines a priori éloignés. L'histoire récente du transport optimal de mesure est à cet égard très représentative. Initié à la fin du XVIIIe siècle par Monge, développé par Kantorovich au milieu du XXe siècle pour ses applications en économie, ce sujet a connu une renaissance spectaculaire dans les 15 der- nières années, à partir des travaux de Brenier en méca- nique des fluides. Les spécialistes actuels, peut-être frap- pés de délire monomaniaque voient maintenant du transport optimal partout : depuis les équations semi- géostrophiques en météorologie jusqu'aux problèmes isopérimétriques, en passant par les milieux granulaires, la physique statistique et les inégalités de Sobolev. Essayons de retracer quelques étapes de cette renais- sance. Notons que, conformément à un phénomène assez courant, Brenier a « redécouvert » certains résultats déjà connus ; mais que cette redécouverte, loin d'être super- flue, a apporté un nouvel éclairage au domaine qui, sans cela, n'aurait certainement pas acquis sa notoriété actuelle. Pour comprendre le contexte dans lequel s'inscrivaient les travaux de Brenier, commençons par quelques rappels élémentaires de mécanique des fluides. L'équation d'Euler incompressible est l'une des équations les plus simples, les plus anciennes et les plus mystérieuses de toute la mécanique des fluides. Dans sa formulation dite Lagrangienne, elle peut se décrire comme suit.

  • travaux de brenier en méca- nique des fluides

  • problème de monge-kantorovich

  • trajectoire du fluide aux instants ultérieurs

  • brenier

  • problème classique


Voir icon arrow

Publié par

Nombre de lectures

55

Langue

Français

Transport optimal de mesure : coup de neuf pour un très vieux problème Bien connue depuis plusieurs siècles pour ses applications logistiques et économiques, la problématique du transport optimal de mesure connaît actuellement un renouveau spectaculaire à cause de ses liens insoupçonnés avec la mécanique des fluides, les équations aux dérivées partielles et d’autres domaines des mathématiques. n dit souvent que l’une des plus grandes satisfac-au sens où pour toutt, l’applicationg(t,)est un difféo-tions des mathématiciens consiste à établir desmorphisme desur. Pour traduire l’incompressibilité réceOnte du transport optimal de mesure est à cet égardLebesgue:g#λ=λ(encadré 1). En d’autres termes,le liens entre domainesa prioriéloignés. L’histoiredu fluide,on impose quela mesure deg préserve e très représentative. Initié à la fin duXVIIIvolume occupé par un ensemble de particules donné nesiècle par e Monge, développépar Kantorovich au milieu duXXvarie pas au cours du temps. La fonctiong(t,)appar-siècle pour ses applications en économie,ce sujet atient donc au groupeSDiff()desdifféomorphismes de connu une renaissance spectaculaire dans les 15 der-préservant la mesure de Lebesgue. nières années,à partir des travaux de Brenier en méca-Dans ce formalisme, l’équation d’Euler s’écrit nique des fluides. Les spécialistes actuels, peut-être frap-2 pés de délire monomaniaque voient maintenant dug (t,x)= ∇p(t,x), (1) transport optimal partout :depuis les équations semi-2 t géostrophiques en météorologie jusqu’aux problèmes où l’on noteple vecteur des dérivées partielles de la isopérimétriques, en passant par les milieux granulaires, fonction scalairep(« pression ») par rapport àx,x,x. la physique statistique et les inégalités de Sobolev.1 2 3 Il ne faut pas spécifier d’équation surp: cette marge de Essayons de retracer quelques étapes de cette renais-manœuvre est indispensable pour compenser la sance. Notons que, conformément à un phénomène assez contraintegSDiff(). Une formulation plus connue courant, Brenier a « redécouvert » certains résultats déjà de l’équation d’Euler,formellement équivalente à (1), connus ; mais que cette redécouverte, loin d’être super-porte sur le champ de vitessesu:u/∂t+(u∙ ∇)u flue, a apporté un nouvel éclairage au domaine qui, sans +∇p=0 . cela, n’auraitcertainement pas acquis sa notoriété actuelle. L’un des problèmes ouverts les plus célèbres de la théorie mathématique de la mécanique des fluides Pour comprendre le contexte dans lequel s’inscrivaient consiste à construire des solutions « raisonnables » de les travaux de Brenier, commençons par quelques rappels l’équation d’Euler. Sous certaines hypothèses de régula-élémentaires de mécanique des fluides. L’équation rité, cela équivaut à construire des trajectoires quimini-d’Euler incompressibleest l’une des équations les plus misent l’action, localement en temps: pour tous tempst0 simples, lesplus anciennes et les plus mystérieuses de ett1suffisamment proches, pour toute trajectoirem(t,) toute la mécanique des fluides. Dans sa formulation dite à valeurs dansSDiff()que, tellem(t0,)=g(t0,)et Lagrangienne, elle peut se décrire comme suit. Soitun m(t1,)=g(t1,), on doit avoir 3 ouvert deR, modélisant le récipient contenant le fluide,      2 2 t1t1 de volume normalisé à 1 ; on noteraλla mesure dedg dm d xdtd xdt.(2)    Lebesgue restreinte à. L’état du fluide est modélisé par dt t0dtt0une applicationg(t,x), oùtest la variable de temps etx la variable d’espace ;g(t,x)le problème est de construireEn termes géométriques,représente la position au tempstd’une « particule » qui au temps 0 se serait trou-desgéodésiquesdans l’espaceSDiff(). Remarquons vée au pointx. Nous supposerons que le flot est régulier,bien qu’il y a deux problèmes possibles :
– Cédric Villani, École normale supérieure de Lyon, UMPA, 46 allée d’Italie, 69364 Lyon cedex 07. cvillani@umpa.ens-lyon.fr 114
Encadré 1
Transport optimal de mesure : coup de neuf pour un très vieux problème
MESURE IMAGE, MARGINALES
Rappelons quelques notions élémentaires qui serviront tout au long de l’article. Soit T une application,µetνdeux mesures de probabilité. On dit queνest lamesure imagedeµ, ou que Tpar T transportela mesureµsur la mesureν, et on note (par exemple) T#µ=ν, si pour toute application mesurable positive (ou bornée) b on a   b(T(x))dµ(x)=b(y)dν(y).(1)
Si T#µ=µ, on dit que Tpréserve la mesureµ. Par (1), on   sait alors quebT dµ=b dµpour tout b0. p En particulier, pour tout p,Tpest déterminé : c’est le L(dµ) moment d’ordre p deµ. Siµetνont des densités respectivesf et g par rapport à la mesure de Lebesgue, et si l’applicationT estinjective et définit un changement de variable admissible (par exemple si 1 c’est unC difféomorphisme),alors on établit aisément l’équation f(x)=g(T(x))|det(DT(x))|,
– soit on se donne la valeur deg(t,)ent=t0ett=t1, soitg0etg1, et on cherche à construire une solution (une trajectoire optimale) reliantg0àg1. En d’autres termes, on connaît l’état du fluide à deux instants donnés et on cherche à reconstituer la trajectoire entre ces deux ins-tants ; – soit on se donne la valeur deg(t,)ent=t0, soitg0, et sa dérivée (la vitesse initiale des particules), dg/dt|t=t0, et on cherche à prédire la trajectoire du fluide aux instants ultérieurs. Les deux problèmes ne sont pas équivalents ; le pre-mier est celui qui nous préoccupera.A prioriplus simple que le second,il recèle cependant des surprises :par exemple, unrésultat de Shnirelman implique qu’il n’existe pas toujoursde trajectoire optimale.
GEODÉSIQUES APPROCHÉES
Au milieu des années 80,pour tenter d’y voir plus clair, Breniercherchait à construire des géodésiques approchées, parune procédure de discrétisation du temps. Considérons le cas extrêmement simplifié où il n’y a que trois temps :t0,t1, ett1/2=(t0+t1)/2. On se donneg0=g(t0,),g1=g(t1,)on note, et 2 m2=xm d. Il est facile de s’apercevoir que la L discrétisation du problème (2) consiste à rechercher
où DT désigne l’application Jacobienne de T. C’est la formule classique du changement de variables ! Quandµetνsont définies sur le même espace, le transport de mesure peut s’exprimer en termes purement physiques : imaginonsµetνcomme les densités de répartition d’un grand nombre de particules. EcrireT#µ=νrevient à dire que si les particules sont au départ réparties selon la configurationµet que l’on transporte chaque particule de l’emplacement x à l’emplacement T(x), alors les particules seront réparties, après transport, selon la configurationν. Soitπune mesure de probabilité sur un espace produit X×Y .On appellemarginalesdeπles mesures de probabilitéµetνdéfinies comme mesures images deπpar les projections(x,y)→x et(x,y)→y. Prendre la marginale surX revientà intégrer par rapport àyY, et vice versa. De manière équivalente, pour toutes fonctionsϕ etψintégrables, on a  [ϕ(x)+ψ(y)]dπ(x,y)=ϕdµ+ψdν.
g1/2SDiff()tel que pour toutmSDiff(), 2 2 g1g1/22+ g1/2g02 L L 2 2 g1m2+ mg02. L L
(3)
Comme tous les éléments deSDiff()ont la même 2 normeLl’équation (3) peut se réécrire :(encadré 1), pour toutmSDiff(), 2 2 g1/2h2mh2,(4) L L h=(g0+g1)/2. Autrement dit,leg1/2que nous cherchons doit être laprojection orthogonaledu milieuh deg0etg1, sur le groupeSDiff(), au sens de la norme 2 L. Comme le lecteur le vérifiera sans peine,le groupe SDiff()il n’est pasn’est pas convexe ; par ailleurs, 2 fermé au sens de la topologieL. La non-convexité empêche d’appliquer les théorèmes classiques de projec-tion sur un convexe,mais ce n’est pas un problème fondamental très sérieux ; en revanche, on ne peut envi-sager de définir une projection sur un ensemble non fermé (que serait la projection d’un élément de SDiff()\SDiff()?)... Il faut en conclure que le pro-blème de minimisation (4) est en généralmal posé: il n’admet pas toujours de solution pour unhgénéral.
115
Pour contourner ce problème,on va appliquer une procédure classique du calcul des variations : larelaxa-tion, quiconsiste à remplacer l’espace trop restreint SDiff()par son adhérenceSDiff(). Ce dernier espace est constitué detoutesles applicationss(pas nécessaire-ment bijectives) préservant la mesure de Lebesgue ; on le noteraS(). Il est possible de montrer par des théorèmes assez généraux que l’opération de projection surS()est « presque toujours » bien définie. Mais on peut mieux faire et donner une construction plus explicite. Soitπla mesure image sur×par, définieπ=(m×h)#λ. Par définition de la mesure image, 2 2 mh2= |mh| L 2 = |xy|dπ(x,y). ×Par ailleurs, il est facile de vérifier que lesmarginalesde π(encadré 1) sont la mesure de Lebesgueµ=λd’une part, et la mesureν=h#λd’autre part. Notre problème de minimisation peut maintenant être comparé aupro-blème plus généralqui consiste à minimiser la quantité 2 |xy|dπ(x,y) ×parmi tous lesπ, mesuresde probabilité sur l’espace produit×dont les marginales sontλeth#λ. En développant le carré,on voit qu’il est équivalent de maximiser la quantité xy dπ(x,y). ×En termes probabilistes, nous cherchons àmaximiser les corrélations entre des variables aléatoires de lois res-pectivesµetν, et dont la loi jointe serait l’inconnueπ. Partis d’un problème de mécanique des fluides, nous avons abouti à un problème célèbre d’optimisation :le problème deMonge-Kantorovich. Sous sa version la plus générale, on peut l’énoncer ainsi : soientµetνdeux mesures de probabilité sur des espaces respectifsXetY, soitc:X×YR+dite « fonction deune fonction, coût » ; le problème consiste à minimiser lafonctionnelle de coût c(x,y)dπ(x,y) X×Y parmi toutes les mesuresπsurX×Yadmettantµetν pour marginales. Formulé pour la première fois sous cette forme par le célèbre économiste-mathématicien russe Leonid Kantorovich,ce problème avait été étudié dès 1780 par Gaspard Monge. L’existence d’un minimi-seur est un exercice élémentaire d’analyse fonctionnelle,
116
qui ne nous apporte cependant guère d’informations sur le problème initial. Pour en savoir plus, on peut appliquer un célèbre principe de dualité dû à Kantorovich, et que nous appellerons leprincipe du convoyeur(encadré 2). Dans le cas qui nous intéresse,il aboutit à l’identité de type « minimax »  supxy dπ(x,y)=infϕdµ+ϕdν,(5) ϕ π où l’infimum est pris sur toutes les paires(ϕ, ϕ)de fonctions convexes conjuguées : ϕ (y)=sup(xyϕ(x)) x ϕ(x)=sup(xyϕ (y)). y Le problème variationnel à droite de (5) ne semble guère plus simple que celui qui se trouve à gauche... Cepen-dant, en termes de calcul des variations, il est considéra-blement plus agréable : sans perte de généralité, on peut fixer la valeur deϕen un point (cela ne change pas la valeur de l’infimum) ; or,les paires de fonctions convexes conjuguées(ϕ, ϕ), définiessur un ouvert borné, ayantune valeur fixée en un point,forment un sous-ensemblecompactde l’espace des fonctions conti-nues sur cet ouvert. Le supremum est donc atteint dans le membre de droite de (5),par une paire de fonctions convexes. Soit maintenantπune mesure optimale dans le pro-blème de gauche de (5), etϕune fonction convexe opti-male dans le problème de droite de (5) : en utilisant les propriétés de marginales, on peut écrire xy dπ(x,y) ×  =ϕ(x)dµ(x)+ϕ (y)dν(y)   =[ϕ(x)+ϕ (y)]dπ(x,y), ×d’où [ϕ(x)+ϕ (y)xy]dπ(x,y)=0. ×Or, ona toujoursϕ(x)+ϕ (y)xy, etdonc néces-sairement, pourπpresque tousxety, xy=ϕ(x)+ϕ (y). Dans le langage de l’analyse convexe, on dit queyappar-tient au sous-différentiel∂ϕ(x)deϕau pointx. Pour peu que les mesuresµetνsoient absolument continues par rapport à la mesure de Lebesgue,on peut montrer que ∂ϕ(x)= {∇ϕ(x)}et en déduire queν= ∇ϕ#µ, où l’on considèreϕcomme une application allant dedans
Transport optimal de mesure : coup de neuf pour un très vieux problème
n R. A partir de là, il est facile d’identifier notre projection orthogonale comme ∗ −1 s= ∇ϕh=(ϕ)h.(6) Le résultat précédent peut sembler suspect :en composant les deux membres de (6) parϕ, on obtient h= ∇ϕs: (7) l’applicationhest donc la composition deϕpar une application préservant la mesure de Lebesgue – or,nous n’avons fait aucune hypothèse surh, si ce n’est queh#λ soit absolument continue... Il s’agit précisément du remar-quablethéorème de factorisation polairede Brenier : d Théorème 1.Soitun ouvert borné deR(d1),λ d la mesure de Lebesgue restreinte à, et h:Run champ de vecteurs tel que la mesure imageh#λsoit absolument continue. Alors il existe une unique dé-composition de hsous la forme h= ∇ϕs, ϕest un gradient de fonction convexe sur, et s:est une application préservant la mesure de Lebesgue. En outre,s estl’unique projection orthogo-nale de hsur l’espace S().
Ce théorème présente de nombreux points communs avec d’autres théorèmes classiques : en particulier la fac-torisation polaire bien connue des matrices,M=S O (Ssymétrique,Oorthogonale). Moins bien connue d’ailleurs, est la caractérisation du facteurOdans cette décomposition comme la projection orthogonale deM sur le groupe des matrices orthogonales ! Les géomètres pourront également reconnaître dans le théorème de Bre-nier une version non linéaire du théorème de décomposi-tion de Hodge.
Laissons désormais de côté la mécanique des fluides et continuons à étudier le problème de minimisation de Monge-Kantorovich. Il existe en général de nombreuses manières de transporter des mesures l’une sur l’autre, et c’est un problème classique que de construire des trans-ports « remarquables »,en un certain sens. Or,nous venons de constater que deux mesuresµetνsur, absolument continues,pouvaient être transportées l’une sur l’autre par un gradient de fonction convexe. Voici un énoncé un peu plus général :
Théorème 2.Soient dµ(x)=f(x)et dd xν(y) d =g(y)deux mesures de probabilité surd yR, absolu-ment continues par rapport à la mesure de Lebesgue. Alors il existe un unique gradient de fonction convexe
Encadré 2 LE PRINCIPE DU CONVOYEUR (« SHIPPER »)
C’est une façon imagée d’exprimer ladualité de Kantorovich. Soit un mathématicien industriel devant organi-ser le convoi de sa production de charbon depuis les mines jusqu’aux usines. La production et la consommation de char-bon sont représentées par des mesures positives, les quantités totales étant en adéquation (les mesures ont même masse). Le souci de notre mathématicien est de minimiser le coût dépensé en transport, soitc(x,y)dπ(x,y), où c(x,y)représente le coût du transport dex à y, et dπ(x,y)la quantité élémentaire de charbon transportée du pointx aupoint y. Les marginales deπsont fixées : ce sont respectivement les densités de charbon produit, et consommé ; nous sommes donc en présence d’un problème de Monge-Kantorovich. Un autre mathématicien se manifeste alors et suggère de lui sous-traiter le problème de transport : « Je me contenterai de te faire payer un prix à l’embarquement et un prix au débarquement ; ces prix varieront en fonction de l’emplacement, et je suis prêt à octroyer des compensations financières (prix négatifs) pour certains endroits. Tu y seras forcément gagnant, car la somme du prix d’embarquement et du prix de débarquement seratoujoursinférieure ou égale au prix que tu paierais pour faire transporter la marchandise ! » Bien sûr, l’affaire est conclue.
Si l’on noteϕ(x)le prix à payer pour embarquer au pointx etψ(y)y, on voitle prix à payer pour débarquer au point que le convoyeur se fait payer   ϕ(x)dµ(x)+ψ(y)dν(y).(1)
Son problème est donc maintenant de fixer des prixϕetψde la manière la plus avantageuse, c’est-à-dire de façon à maximiser (1) tout en respectant la contrainte ϕ(x)+ψ(y)c(x,y), qui seule garantit que son offre est suffisamment attrayante pour qu’on lui laisse la charge de toutle transport. Leprincipe du convoyeur(dualité de Kantorovich) assure que la somme d’argent (1) peut être aussi proche que l’on souhaite du coût optimal de Monge-Kantorovich. En termes mathématiques,  infc(x,y)dπ(x,y)=supϕdµ+ψdν, π (ϕ,ψ) où l’infimum à gauche est pris sur toutes les mesuresπde marginalesµetνet le supremum à droite est pris sur toutes les paires de fonctions de prix(ϕ,ψ)vérifiant l’inégalité ϕ(x)+ψ(y)c(x,y)pour tous xet y.
117
(unique au sens de : déterminéf(x)partout)d x-presque ϕ, tel que ϕ#µ=ν. 2 De plus,si les seconds moments|x|dµ(x)et 2 |y|dν(y)alorssont finis,ϕest l’unique minimiseur de la fonctionnelle de coût quadratique 2 |xT(x)|dµ(x)
parmi toutes les applicationsT quitransportentµsurν.
Sif,getϕsont suffisamment régulières, alors on peut facilement en déduire (encadré 1) queϕest une solution de l’équation de Monge-Ampère
f(x) 2 det(Dϕ)(x)=. g(ϕ(x))
L’étude de cette équation fort célèbre est considérée comme extrêmement ardue,du fait de son caractère « très non linéaire ». Le théorème 2 fournit donc une méthode, remarquablementsimple et générale,pour construire dessolutions faiblesde cette équation. C’est un problème très délicat que de savoir si ces solutions faibles sont des solutions classiques... Dans une série d’articles difficiles,Caffarelli montre que sifetgsont kstrictement positives et de classeC(kN, α]0,sens où leurs dérivées d’ordre1[), auksont Hölder-continues d’exposantα, alorsϕest régulière, de k+2classeC. Ce résultat est bien sûr optimal dans sa catégorie.
INTERPOLATION DE McCANN
Changeons radicalement de paysage physique. Au début des années 1990,McCann travaillait à démontrer l’unicité des formes d’équilibre de certains systèmes physiques (étoile,gaz en interaction...) dont l’état est
modélisé par une mesure de probabilité. Le problème mathématique se pose de la manière suivante : étant don-née telle ou telle fonctionnelle d’énergieF, peut-on démontrer qu’un minimiseur existe et qu’il est unique sous telle ou telle contrainte ? Le problème isopérimé-trique et ses variantes (formes des cristaux,des gouttes d’eau, etc.) appartiennent à cette catégorie. Ces résultats d’unicité sont le plus souvent subordonnés à des proprié-tés destricte convexité, selon un schéma de preuve très classique. En effet, siµetνsont deux minimiseurs, alors pour toutt[0,peut définir leur « interpolation1] on linéaire » ρt=(1t+tν.(8) SiFest strictement convexe, la fonctiont→Ft)l’est également (sauf siµ=ν), et présente un minimum strict pour un certaint]0,1[ –ce qui contredit l’hypothèse de minimalité pourµetν. Bien évidemment, cette pro-cédure classique ne s’appliquait pas aux exemples consi-dérés par McCann (cela aurait été trop facile !!). Il eut cependant l’idée de substituer à l’interpolation (8) une autre recette, basée sur le transport optimal. Définissons donc, pour toutt(« temps ») compris entre 0 et 1, ρt=[(1t)Id+tϕ]#µ.(9) Bien sûr,ρ0=µ,ρ1=ν. Les deux exemples de la figure ci-dessous montreront combien cette procédure est qualitativement différente de la procédure plus classique d’interpolation linéaire. Dans chacun des deux cas envisagés,la densité de départ est représentée en vert, la densité d’arrivée en rouge, la den-sité interpolée en jaune. Les deux figures du haut consi-dèrent une interpolation par transport de mesure (inter-polation par déplacement),les deux figures du bas une interpolation linéaire. Noter que, dans les deux cas, non seulement la forme générale, mais aussi les supports des mesures interpolées sont différents. Le théorème suivant, dû à McCann, illustre l’intérêt de cette procédure :
Figure -Différence entre l’interpolation « linéaire » et l’interpolation par transport.
118
Voir icon more
Alternate Text