PRINCIPE DE FERMAT

La nature agit toujours par les voies les plus courtes Pierre de Fermat

Pierre de Fermat proposa que les rayons lumineux répondaient à un principe très général auquel on donna son nom. Ce principe, de nature variationnelle, permet à lui seul de retrouver toutes les lois de l'optique géométrique. Après une présentation de ce principe tel qu'il a été formulé par Fermat, on met en évidence la nécessité d'un énoncé plus général. On passe en revue différentes applications allant des lois de Snell-Descartes à l'équation fondamentale de l'optique géométrique.
Les deux premières parties de ce cours sont d'un accès facile et peuvent suffire pour une première approche du principe de Fermat. En revanche, la dernière partie est plus exigeante, car elle demande une certaine maîtrise du calcul variationnel.

Le principe de moindre temps

Énoncé de Fermat

En 1637, René Descartes (1596-1650) publie, en complément de son célèbre Discours de la méthode, un traité d'optique. Il y explique notamment le phénomène de réfraction et prévoit la loi des sinus : \[ \frac{\sin i_1}{\sin i_2}=\mathrm{C^{te}} \] Les conceptions de Descartes reposent essentiellement sur l'analogie avec la mécanique et sa description prévoit notamment que la lumière va plus vite dans l'eau que dans l'air. Ces considérations suscitent un débat au sein de la communauté scientifique, et des savants tels que Pierre de Fermat (1601-1665) contestent l'approche de Descartes. Fermat adopte un point de vue différent, reposant sur un principe d'économie.
Il étend le principe de Héron d'Alexandrie relatif à la . Imaginez un rayon lumineux partant d'un point A et se dirigeant jusqu'à un autre point B. Fermat propose que parmi tous les chemins possibles entre A et B, la lumière emprunte seulement le chemin le plus rapide.

Discours De La Methode — Dans son Discours de la méthode, Descartes aborde la Dioptrique.

Principe de Fermat (1657)

La lumière se propage d'un point à un autre de façon à minimiser son temps de trajet

Il publiera ses résultats en 1662 dans synthèses pour les réfractions. Son principe est le premier principe variationnel de la physique ; il présente en outre l'intérêt d'être d'une très grande généralité, et nous verrons que son énoncé moderne contient en elle toute l'optique géométrique. De surcroît, ce point de vue variationnel sera très fécond en physique puisqu'il mènera à la mécanique analytique jusqu'aux théories quantiques des champs[1].

Propagation dans un milieu homogène

Illustrons les premières conséquences élémentaires de ce principe.

Dans un milieu homogène, la lumière se propage à la même vitesse partout. Dans ce cas, le trajet qui minimise la durée entre deux points A et B correspond à la courbe de longueur minimale, c'est-à-dire au segment [AB] si l'espace est . Ainsi, dans tout milieu homogène, la lumière se propage en ligne droite. Inversons le sens du parcours et -bien entendu- cela n'affecte pas la durée du trajet qui reste minimale. En conséquence, le chemin suivi est indépendant du sens de parcours.

En résumé, le principe de propagation rectiligne et celui du retour inverse de la lumière découlent naturellement du principe de Fermat.

Réflexion sur un miroir plan

Considérons un rayon lumineux issu d'un point source A se propageant dans un milieu homogène en direction d'un miroir plan. Après réflexion sur celui-ci, le rayon atteint le point B. Cherchons quel trajet doit suivre la lumière. Pour cela, définissons le repère O\(xyz\) de sorte que le plan \(x\)O\(z\) matérialise le miroir plan. Plaçons A et B dans le plan \(x\)O\(y\) : on note \((x_1,y_1,0)\) et \((x_2,y_2,0)\) leurs coordonnées avec \(y_1>0\) et \(y_2>0\). Calculons la durée \(T_\text{AB}\) du trajet d'un rayon qui se réfléchit en un point I de coordonnées \((x,0,z)\) à déterminer. La durée du trajet vaut \[ T_\text{AB}=\frac{\text{AI}+\text{IB}}{v_1} \]

où \(v_1\) est la vitesse de la lumière. En vertu du théorème de Pythagore, on obtient \[ T_\text{AB}(x,z)=\frac{1}{v_1} \left(\sqrt{(x-x_1)^2+y_1^2+z^2}+\sqrt{(x-x_2)^2+y_2^2+z^2}\right) \] La fonction \(T_\text{AB}(x,z)\) présente un minimum si \(\dfrac{\partial T}{\partial x}=0\) et \(\dfrac{\partial T}{\partial z}=0\), c'est-à-dire si \[\left\{\begin{array}{ccl} \dfrac{(x-x_1)}{\sqrt{(x-x_1)^2+y_1^2+z^2}}+\dfrac{(x-x_2)}{\sqrt{(x-x_2)^2+y_2^2+z^2}} &= &0\\[4mm] \text{et} & &\\[1mm] \dfrac{z}{\sqrt{(x-x_1)^2+y_1^2+z^2}}+\dfrac{z}{\sqrt{(x-x_2)^2+y_2^2+z^2}} &= &0 \end{array}\right.\] La dernière relation aboutit à \(z=0\). En d'autres termes, A, I et B appartiennent au plan d'incidence. On retrouve donc ici la première loi de la réflexion.

Quant à l'autre relation, elle donne \[ \dfrac{(x-x_1)}{\text{AI}}=\frac{(x_2-x)}{\text{IB}} \] égalité qui n'est possible que si \(x\) est compris entre \(x_1\) et \(x_2\) : le rayon réfléchi passe donc de l'autre côté de la normale. Si l'on appelle \(i_1\) et \(i_2\) les angles de chaque côté, la relation précédente se réécrit \(\sin i_1=\sin i_2\), soit \begin{equation} \fcolorbox{#FFFFFF}{#FFF8F0}{\quad \(\displaystyle i_1=i_2 \notag \)\quad} \;\color{#FF9900}{\heartsuit} \end{equation} Et la deuxième loi de la réflexion est ainsi prouvée.

un calcul de dérivée seconde permet de vérifier que la durée \(T_\text{AB}(x,z)\) présente bien un minimum local lorsque \(i_1=i_2\). Pour s'en convaincre, jouez avec la simulation ci-dessous

Déplacer le point I à l'aide de la souris ou du clavier (touches → ou ←) et trouver le chemin optimal.

Réfraction

De la même manière, le principe de Fermat permet de retrouver les lois de Snell-Descartes en y apportant un éclairage nouveau. En effet, imaginons deux milieux transparents homogènes séparés par un dioptre plan. Appelons \(v_1\) et \(v_2\) les vitesses respectives de la lumière dans chacun de ces milieux. Pour simplifier, supposons le problème plan (on pourrait montrer comme précédemment que le rayon optimal reste dans le plan d'incidence). Considérons A un point fixe du milieu 1 de coordonnées \((x_1,y_1)\) et un point B du milieu 2 de coordonnées \((x_2,y_2)\) puis cherchons le trajet qui minimise le temps de parcours entre A et B.

On comprend aisément que si la lumière se déplace plus vite dans le milieu 1, elle "aura intérêt" à allonger son parcours dans ce milieu et à le raccourcir dans l'autre ce qui explique la réfraction. La durée \(T_\text{AB}\) du trajet ne dépend alors que de la position du point incident I de coordonnées \((x,0)\) : \[ T_\text{AB}=\frac{\text{AI}}{v_1}+\frac{\text{IB}}{v_2}=\frac{\sqrt{(x-x_1)^2+{y_1}^2}}{v_1}+\frac{\sqrt{(x-x_2)^2+{y_2}^2}}{v_2} \] Cette durée présente un extremum (minimum ici) si sa dérivée s'annule : \[ \frac{\mathrm{d}T_\text{AB}}{\mathrm{d}x}=\frac{1}{v_1}\frac{(x-x_1)}{\sqrt{(x-x_1)^2+{y_1}^2}}-\frac{1}{v_2}\frac{(x_2-x)}{\sqrt{(x-x_2)^2+{y_2}^2}}=0 \] Par conséquent, \((x-x_1)\) et \((x_2-x)\) sont de même signe, ce qui signifie que \(x\) est entre \(x_1\) et \(x_2\) et que le rayon se réfracte en passant de l'autre côté de la normale (comme pour la réflexion). Si l'on fait intervenir les angles d'incidence et de réfraction \(i_1\) et \(i_2\), la dernière relation se ramène simplement à \[ \frac{\sin i_1}{v_1}=\frac{\sin i_2}{v_2} \] Non seulement on retrouve la loi de Snell-Descartes, mais on donne un sens physique aux indices de réfraction en prévoyant qu'ils doivent varier comme l'inverse de la vitesse de la lumière dans le milieu. La lumière doit donc voyager moins vite dans l'eau que dans l'air car on sait que l'angle de réfraction diminue lors du passage eau-air. Il fallut attendre l'année 1850 pour confirmer cette prévision à l'origine du désaccord entre Fermat et Descartes. C'est Léon Foucault qui fournira la preuve mettant définitivement fin au dogme cartésien selon lequel la lumière se propage plus vite dans les corps denses.

En adoptant la convention que l'indice du vide vaut un, on obtient \(n\stackrel{\text{def}}= \frac{c}{v}\) et la relation de réfraction s'écrit \begin{equation} \fcolorbox{#FFFFFF}{#FFF8F0}{\quad \(\displaystyle n_1\sin i_1=n_2\sin i_2 \quad\text{avec}\quad n_1=\frac{c}{v_1} \quad\text{et}\quad n_2=\frac{c}{v_2} \notag \)\quad} \;\color{#FF9900}{\heartsuit} \end{equation}

Un calcul de dérivée seconde permet de vérifier que la durée \(T_\text{AB}\) présente bien un minimum local lorsque \(n_1\sin i_1=n_2\sin i_2\). On peut aussi s'en convaincre en jouant avec l'animation ci-dessous (\(L(\text{AB})\) est proportionnel à \(T_\text{AB}\)).

Déplacer le point I à l'aide de la souris ou du clavier (touches → ou ←) et trouver le chemin optimal.

Énoncé moderne

La durée est-elle toujours minimale ?

Selon Fermat, la durée du trajet lumineux est supposée présenter un minimum local. Or, il existe des situations simples où, à l'évidence, le principe initial de Fermat est invalidé. Analysons deux cas particuliers.

Le miroir elliptique — Considérons une surface elliptique de révolution dont la face interne est rendue parfaitement réfléchissante. Raisonnons dans le plan contenant l'axe de révolution. Dans ce plan, le miroir est représenté par une ellipse. On peut montrer que pour tout point M situé sur l'ellipse, on a \[ \text{FM}+\text{F'M}=\mathrm{C^{te}} \] où F et F' sont deux points —que l'on appelle les foyers— placés sur l'axe de révolution de part et d'autre du centre O.

Prenons maintenant un rayon lumineux issu de F que l'on dirige vers le point I situé à l'intersection du miroir et du plan de symétrie perpendiculaire à l'axe optique. Compte tenu des lois de la réflexion, le rayon se réfléchit en se dirigeant vers F'. La durée du trajet [FIF'] vaut donc \[ T_\text{FF'}=\frac{\text{FI}+\text{IF'}}{v} \] où \(v\) est la vitesse de la lumière dans l'air. Si maintenant on considère un point M sur l'ellipse, voisin de I, on a par construction, \[ \text{FI}+\text{IF'}=\text{FM}+\text{MF'} \] de sorte que le trajet [FIF'] n'est pas de moindre durée mais de durée stationnaire. Ici tous les rayons issus de F se réfléchiront en passant par F' avec la même durée constante.

Le miroir sphérique concave — Imaginons maintenant un miroir sphérique concave de rayon \(R\) et de centre C. Fixons un point B dans la sphère mais ailleurs qu'en C et cherchons quel(s) trajet(s) peut parcourir un rayon lumineux s'il part de C et arrive en B après une réflexion.

Tout rayon issu de C arrive sur la surface sphérique en un point I avec un angle d'incidence nul, car [CI] est un rayon de la sphère. Par conséquent, le rayon doit se réfléchir avec également un angle nul, c'est-à-dire rebrousser chemin. En conclusion, il n'existe que deux trajets possibles : ceux pour lesquels I, C et B sont alignés.
Intéressons nous de plus près au cas où C est entre I et B. Envisageons un trajet virtuel [CMB] avec M voisin de I sur la sphère et comparons sa longueur avec celle du trajet réellement emprunté par la lumière. Pour cela, définissons le point N comme l'intersection de la droite (BM) avec le cercle de centre B et de rayon [BI]. On a \[ \text{CI}+\text{IB}=\text{CM}+\text{NB}>\text{CM}+\text{MB} \] car \(\text{NB}>\text{MB}\) par hypothèse. Ainsi, le trajet [CIB] présente une durée localement maximum.

style=width:200px; — Miroir sphérique concave

Comme on le voit, il existe des situations où la lumière choisit des trajets qui présentent des durées localement maximales voire constantes, en contradiction avec l'énoncé de Fermat. On peut qu'il faut changer la formulation initiale en remplaçant le terme "durée minimale" par "durée stationnaire".

Principe de Fermat

Lors de son parcours entre deux points A et B, la lumière suit un trajet qui rend la durée de celui-ci stationnaire par rapport à tout trajet infiniment voisin.

Précisons ce que le terme "stationnaire" signifie mathématiquement. Imaginons que \(\mathcal{C}\) représente la courbe effectivement suivie par la lumière entre A et B. Lorsque l'on modifie de façon infinitésimale \(\mathcal{C}\), tout en fixant A et B, alors le temps de trajet \(T_\text{AB}\) varie également de façon infinitésimale. Cependant, dans le cas d'une durée stationnaire, sa variation est nulle au premier ordre. Une durée minimale ou maximale sont des durées stationnaires mais la réciproque n'est pas vraie. Mathématiquement, cela signifie que la différentielle de \(T_\text{AB}\) est nulle.

Relation avec le chemin optique

Par définition, le chemin optique d'un rayon lumineux partant de A et arrivant en B est la quantité

Chemin optique

\[ L_\text{AB}\stackrel{\text{def}}=\int_\text{A}^\text{B} n(\text{M})\,\mathrm{d}s \quad\text{avec}\quad \text{M}\,\in\,\mathcal{C} \]

c'est-à-dire l'indice de réfraction intégré le long du trajet lumineux \(\mathcal{C}\) (\(\mathrm{d}s\) est l'élément d'arc infinitésimal). Le chemin optique étant homogène à une longueur, il s'exprime en mètre. Notez que dans le vide, cette notion se confond avec la longueur d'arc \(\overset{\frown}{AB}\).

Le temps de parcours est lié au chemin optique. En effet, en un point M de \(\mathcal{C}\), la lumière se propage à la vitesse \(v=c/n\) de sorte que la durée du trajet s'écrit \[ T_\text{AB}=\int_{t_\text{A}}^{t_\text{B}}\mathrm{d}t= \int_\text{A}^\text{B}\frac{\mathrm{d}s}{v(\text{M})}= \frac{1}{c}\int_\text{A}^\text{B}n(\text{M})\,\mathrm{d}s \] On trouve donc la relation simple \begin{equation} \fcolorbox{#FFFFFF}{#FFF8F0}{\quad \(\displaystyle L_\text{AB}=c\,T_\text{AB} \notag \)\quad} \;\color{#FF9900}{\heartsuit} \end{equation}

Le chemin optique est tout simplement proportionnel à la durée du trajet. On peut donc reformuler le principe de Fermat en terme de chemin optique :

Principe de Fermat

Lors de son parcours entre deux points A et B, la lumière suit un trajet qui rend le chemin optique de celui-ci stationnaire par rapport à tout trajet infiniment voisin.

Stigmatisme

Considérons un système optique constitué de dioptres et/ou de miroirs. Si tout rayon issu d'un point A arrive, après avoir traversé le système optique, en un point A', on dit que A' est l'image de A, et le système optique est rigoureusement stigmatique vis à vis des points A et A'.

En vertu du principe de Fermat, un rayon lumineux issu de A et traversant le système optique, parviendra en A' s'il existe un trajet qui présente un chemin optique stationnaire. Aussi, tous les rayons issus de A arriveront en A' si le chemin optique \(L_\text{AA'}\) est une fonction partout stationnaire, c'est-à-dire constante.

Condition de stigmatisme

Un système optique est stigmatique vis à vis du couple objet-image (A,A') si, et seulement si le chemin optique \(L_\text{AA'}\) est constant pour tous les rayons lumineux joignant A à A' à travers le système optique.

Excepté le miroir plan, il n'existe pas de système optique rigoureusement stigmatique pour tout point. En revanche, de nombreux systèmes présentent un stigmatisme rigoureux pour certains points particuliers. Par exemple :

le miroir sphérique conjugue son centre avec lui-même ;
le miroir elliptique conjugue un foyer avec l'autre foyer ;
la parabole conjugue un point à l'infini sur son axe optique avec son foyer.

Le stigmatisme est évidemment une propriété très recherchée si l'on souhaite former des images. La plupart du temps, cette propriété n'est vérifiée que dans un cadre approximatif pour un ensemble restreint de rayons ; on parle alors de stigmatisme approché.

Application : lentille plan-convexe dans l'approximation paraxiale

Plaçons entre deux points A et A' une lentille mince plan convexe, d'indice \(n\). Appelons \(d_1\) et \(d_2\) les distances qui séparent ces points de la lentille. On souhaite déterminer le profil de la lentille, c'est-à-dire la façon dont l'épaisseur locale \(e(z)\) varie avec la coordonnée \(z\), qui garantisse que A et A' soient conjugués, ceci dans l'approximation paraxiale.

Prenons un rayon issu de A arrivant sur la lentille à la hauteur \(z\) et convergeant ensuite vers A'. Le chemin optique se décompose en deux termes \(L_\text{AA'}=L_\text{vide}+\Delta L\) où \(L_\text{vide}\) représente le chemin optique du rayon dans le vide et \(\Delta L\), celui introduit par la lentille. D'après le théorème de Pythagore, on a \[ L_\text{vide}=\sqrt{{d_1}^2+z^2}+\sqrt{{[d_2-e(z)]}^2+z^2}\simeq d_1+d_2-e(z)+\frac{z^2}{2D} \] à condition de poser \(D=d_1d_2/(d_1+d_2)\) et de considérer \(z\) et \(e(z)\) petit devant \(d_1\) et \(d_2\).

Le terme supplémentaire vaut simplement \[ \Delta L\simeq n\,e(z) \] Pour ces deux calculs, on a utilisé l'approximation paraxiale puisque l'on a considéré le rayon dans la lentille quasi parallèle à l'axe optique. Finalement, le chemin optique vaut \[ L_\text{AA'} \simeq d_1+d_2+\frac{z^2}{2D}+(n-1)\,e(z) \] A et A' seront conjugués (dans l'approximation paraxiale) si, et seulement si \(L_\text{AA'}\) est constant. Cette constante peut être obtenue en prenant \(z=0\) : \[ d_1+d_2+\frac{z^2}{2D}+(n-1)e(z)=d_1+d_2+(n-1)\,e_0 \quad\text{soit}\quad e(z)=e_0-\frac{z^2}{2(n-1)D} \] La lentille doit donc présenter un profil parabolique.

Renversons maintenant le raisonnement. Donnons-nous une lentille plan-convexe de profil parabolique \(e=e_0-az^2\) ; on sait alors que tout point A et A' seront conjugués à condition que \[ a=\frac{1}{2(n-1)D} \quad\text{c'est-à-dire}\quad \frac{1}{d_1}+\frac{1}{d_2}=2a(n-1)=V \] On retrouve ainsi la formule de conjugaison des lentilles minces où \(V\) désigne la vergence. Notez que, compte tenu de l'approximation paraxiale, on peut approcher la surface parabolique par une sphère de rayon \(R=1/(2a)\). On retrouve alors le résultat des lentilles minces sphériques, notamment \(V=(n-1)/R\) pour une lentille plan-convexe.

Calcul de trajet lumineux

Le principe de Fermat, en tant que principe variationnel, montre toute sa puissance lorsqu'il est associé aux techniques mathématiques inventées par Euler et Lagrange au 19^ème siècle. La présentation qui suit repose sur ces techniques de calcul variationnel qui devraient faire parti du bagage de fond de tout bon physicien.

Calcul variationnel

Fixons deux points A et B dans le plan \(x\)O\(y\) et considérons une courbe d'équation \(y(x)\) passant par ces deux points. Définissons l'intégrale \[ I_\text{AB}[y]=\int_{x_\text{A}}^{x_\text{B}}f(x,y(x),y'(x))\, \mathrm{d}x \] où \(f(x,y,y')\) est une fonction connue à 3 variables de classe \(\mathcal{C}^1\) et \(y'(x)\) la dérivée de \(y\) par rapport à \(x\). Cette intégrale est un nombre dont la valeur dépend de la fonction \(y(x)\). On appelle ce type d'objets, une fonctionnelle. Le calcul variationnel permet de trouver la fonction \(y(x)\) qui rend \(I_\text{AB}[y]\) stationnaire. C'est Euler le premier qui a établit le résultat suivant : \begin{equation} \fcolorbox{#FFFFFF}{#FFF8F0}{\quad \(\displaystyle \mathrm{d}I_\text{AB}[y]=0 \quad\Longleftrightarrow\quad \frac{\partial f}{\partial y}= \frac{\mathrm{d}}{\mathrm{d}x}\left(\frac{\partial f}{\partial y'}\right) \notag \)\quad} \;\color{#FF9900}{\heartsuit} \end{equation} C'est l'équation d'Euler-Lagrange.

Exemple

Cherchons la courbe du plan qui relie deux points A et B et qui minimise la longueur d'arc \(\overset{\frown}{AB}\) le long de la courbe. Cette longueur s'obtient en intégrant l'élément de longueur \(\mathrm{d}s=\sqrt{\mathrm{d}x^2+\mathrm{d}y^2}\) entre A et B. On obtient \[ \overset{\frown}{AB}=\int_{x_\text{A}}^{x_\text{B}} f(x,y(x),y'(x))\,\mathrm{d}x \quad\text{avec}\quad f(x,y,y')=\sqrt{1+{y'}^2} \] Cherchant la courbe qui rend la longueur d'arc minimale (et donc stationnaire), on peut écrire l'équation d'Euler-Lagrange: \(\dfrac{\partial f}{\partial y}=\dfrac{\mathrm{d}}{\mathrm{d}x}\dfrac{\partial f}{\partial y'}\). Or, \(f\) ne dépend pas de \(y\), par conséquent on trouve \[ \frac{\partial f}{\partial y'}=\mathrm{C^{te}}=\frac{y'}{\sqrt{1+{y'}^2}} \] Il en découle \(y'=a\), c'est-à-dire \(y(x)=ax+b\), avec \(a\) et \(b\) deux constantes obtenues à l'aide des conditions aux limites \(y_\text{A}=y(x_\text{A})\) et \(y_\text{B}=y(x_\text{B})\). Ainsi, comme attendu, le chemin qui rend stationnaire la longueur \(\overset{\frown}{AB}\) est la ligne droite. Ce chemin est de longueur minimale, car tout déformation du segment AB augmente la longueur \(\overset{\frown}{AB}\).

L'équation d'Euler-Lagrange s'étend également au cas où la fonction \(f\) dépend, non pas d'une seule fonction inconnue \(y(x)\), mais de \(n\) fonctions \(y_1(x),\ldots,y_n(x)\). On retiendra le résultat suivant.

Équation d'Euler-Lagrange

La fonctionnelle \[ I[y_1,\,\ldots,\,y_n]= \int_{x_\text{A}}^{x_\text{B}}f(x,\,y_1(x),\,y_1'(x),\,\ldots,\,y_n(x),\,y'_n(x))\, \mathrm{d}x \] est stationnaire si \[ \frac{\partial f}{\partial y_i}= \frac{\mathrm{d}}{\mathrm{d}x}\left(\frac{\partial f}{\partial y_i'}\right) \qquad\text{pour}\qquad i=1\ldots n \]

Équation du rayon lumineux

Appliquons maintenant le calcul variationnel à la recherche du rayon lumineux dans un milieu transparent hétérogène d'indice optique \(n(x,y,z)\) où \(x\), \(y\) et \(z\) désignent les coordonnées cartésiennes. Le chemin optique d'un trajet quelconque entre A et B s'écrit \[ L_\text{AB}\stackrel{\text{def}}=\int_\text{A}^\text{B} n(x,y,z)\, \mathrm{d}s \] Le théorème de Pythagore permet de relier l'élément d'arc \(\mathrm{d}s\) avec les déplacements cartésiens \(\mathrm{d}x\), \(\mathrm{d}y\) et \(\mathrm{d}z\), via \[ \mathrm{d}s=\sqrt{\mathrm{d}x^2+\mathrm{d}y^2+\mathrm{d}z^2}=\sqrt{1+{y'}^2+{z'}^2}\, \mathrm{d}x \] où \(y'\) et \(z'\) désignent les dérivées par rapport à \(x\). Finalement, le chemin optique s'écrit \[ \begin{split} L_\text{AB}&=\int_{x_\text{A}}^{x_\text{B}} f(x,\,y(x),\,y'(x),\,z(x),\,z'(x))\,\mathrm{d}x\\ &\quad\text{avec}\quad f(x,y,y',z,z')=n(x,y,z)\sqrt{1+{y'}^2+{z'}^2} \end{split} \] Le chemin optique est donc une fonctionnelle qui dépend de la forme du trajet via les fonctions \(y(x)\) et \(z(x)\). Le rayon lumineux étant de chemin optique stationnaire, on doit avoir \[ \left\{\begin{array}{rcl} \dfrac{\partial f}{\partial y}&=& \dfrac{\mathrm{d}}{\mathrm{d}x}\dfrac{\partial f}{\partial y'}\\[3mm] \dfrac{\partial f}{\partial z}&=& \dfrac{\mathrm{d}}{\mathrm{d}x}\dfrac{\partial f}{\partial z'} \end{array}\right. \quad\text{soit}\quad \left\{\begin{array}{rcl} \dfrac{\partial n}{\partial y}\sqrt{1+{y'}^2+{z'}^2}&=& \dfrac{\mathrm{d}}{\mathrm{d}x}\dfrac{ny'}{\sqrt{1+{y'}^2+{z'}^2}}\\[3mm] \dfrac{\partial n}{\partial z}\sqrt{1+{y'}^2+{z'}^2}&=& \dfrac{\mathrm{d}}{\mathrm{d}x}\dfrac{nz'}{\sqrt{1+{y'}^2+{z'}^2}} \end{array}\right. \] utilisant le fait que \(\mathrm{d}s=\sqrt{1+{y'}^2+{z'}^2}\,\mathrm{d}x\), on trouve \[ \frac{\partial n}{\partial y}=\frac{\mathrm{d}}{\mathrm{d}s}\left(n\frac{\mathrm{d}y}{\mathrm{d}s}\right) \quad\text{et}\quad \dfrac{\partial n}{\partial z}=\dfrac{\mathrm{d}}{\mathrm{d}s}\left(n\frac{\mathrm{d}z}{\mathrm{d}s}\right) \] On obtient également la même équation pour \(x\), à savoir \[ \frac{\partial n}{\partial x}= \frac{\mathrm{d}}{\mathrm{d}s}\left(n\frac{\mathrm{d}x}{\mathrm{d}s}\right) \] Pour cela, il suffit d'exprimer le chemin optique en choisissant \(y\) comme variable d'intégration à la place de \(x\). Ces trois équations aux dérivées partielles permettent d'obtenir l'équation du rayon lumineux dans tout milieu. On peut les résumer par la relation vectorielle : \[ \overrightarrow{\text{grad}}n= \frac{\mathrm{d}}{\mathrm{d}s}\left[n\left( \frac{\mathrm{d}x}{\mathrm{d}s} \overrightarrow{u_x}+ \frac{\mathrm{d}y}{\mathrm{d}s} \overrightarrow{u_y}+ \frac{\mathrm{d}z}{\mathrm{d}s} \overrightarrow{u_z} \right)\right] \] Or, le vecteur \(\frac{\mathrm{d}x}{\mathrm{d}s}\overrightarrow{u_x}+\frac{\mathrm{d}y}{\mathrm{d}s} \overrightarrow{u_y}+\frac{\mathrm{d}z}{\mathrm{d}s} \overrightarrow{u_z}\) représente le vecteur unitaire tangent au rayon, que nous noterons \(\overrightarrow{u}\). Finalement, l'équation du rayon se met sous la forme

Équation du rayon lumineux

\begin{equation} \overrightarrow{\text{grad}}n=\frac{\mathrm{d}}{\mathrm{d}s}\left(n \overrightarrow{u}\right) \end{equation}

Courbure des rayons — La relation(1)nous confirme bien que dans un milieu homogène \((n=\mathrm{C^{te}})\) le rayon se propage en ligne droite \((\overrightarrow{u}=\overrightarrow{\mathrm{C^{te}}})\). À l'inverse, dans un milieu hétérogène, l'existence d'un gradient d'indice fait courber les rayons lumineux. Voyons plus précisément comment se courbent les rayons.

Par définition du rayon de courbure[2] \(R\), on a \[ \frac{\overrightarrow{u}_{\!\perp}}{R}\stackrel{\text{def}}= \frac{\mathrm{d}\overrightarrow{u}}{\mathrm{d}s} \] où \(\overrightarrow{u}_{\!\perp}\) représente le vecteur normal au rayon et dirigé vers le centre de courbure. Or, d'après l'équation(1), on a \[ \frac{\mathrm{d}(n \overrightarrow{u})}{\mathrm{d}s}= n\frac{\mathrm{d}\overrightarrow{u}}{\mathrm{d}s}+\overrightarrow{u}\frac{\mathrm{d}n}{\mathrm{d}s}= \overrightarrow{\text{grad}}n \] En prenant le produit scalaire avec le vecteur normal on aboutit à la relation \[ \frac{n}{R}=\frac{\overrightarrow{u}_{\!\perp}\cdot \overrightarrow{\text{grad}}n}{n} \] Étant donné que le rayon de courbure est une quantité positive, l'angle formé par les vecteurs \(\overrightarrow{u}_{\!\perp}\) et \(\overrightarrow{\text{grad}}n\) est nécessairement aigu. Autrement dit :

Le vecteur gradient de l'indice est orienté dans le sens de la concavité du trajet

Exemple 1 : mirage optique

Le phénomène du mirage le plus apparent, le mieux constaté, et qui a le plus attiré l'attention générale, est celui que M. Monge a décrit et expliqué dans les Mémoires de l'Institut du Caire : lorsque les soldats français entrèrent dans le désert de l'Égypte, toute l'armée fut témoin d'un effet d'optique aussi nouveau que remarquable : le pays qui forme une vaste plaine horizontale parut tout couvert d'eau ; les villages bâtis sur de petits tertres... présentaient de loin, outre leur image directe, une image renversée ; les soldats, séduits par l'illusion, couraient vainement vers cette eau imaginaire pour étancher la soif qui les dévorait,... Biot, Instit. Mém. sciences, 1809, p. 5

Que ce soit sur une route surchauffée en été ou -comme nous le rapporte Gaspard Monge dans ses mémoires- dans une zone désertique, il peut nous arriver d'avoir l'impression que le sol réfléchit un coin de ciel bleu nous faisant croire à l'existence d'une plus ou moins grande étendue d'eau présente sur le sol. Ces sont liés à la courbure des rayons à proximité du sol surchauffé. En effet, l'air chaud étant moins dense que l'air froid, l'indice optique augmente avec l'altitude ce qui fait naitre un gradient d'indice vertical. Par conséquent, les rayons se courbent comme indiqué sur la Figure ci-dessous. L'observateur voit une image virtuelle du ciel en surimpression du sol.

Courbure des rayons au voisinage d'un sol surchauffé.

Établissons l'équation différentielle du rayon en supposant que l'indice ne varie qui suivant l'altitude \(y\) du lieu. Le chemin optique s'écrit, dans le plan \(x\)O\(y\), \[ L_\text{AB}=\int_{\text{A}}^{\text{B}}n(y)\,\mathrm{d}s=\int_{\text{A}}^{\text{B}}n(y)\,\sqrt{{\mathrm{d}x}^2+{\mathrm{d}y}^2} \] On a le choix entre deux variables d'intégration : \(y\) ou \(x\). Il se trouve que les calculs sont grandement simplifiés si l'on choisit la variable \(y\). Nous allons donc décrire la courbe de lumière par la relation à déterminer \(x(y)\). On obtient \[ L_\text{AB}=\int_{y_\text{A}}^{y_\text{B}}n(y)\sqrt{1+{x'(y)}^2}\, \mathrm{d}y \] Selon le principe de Fermat, le rayon lumineux est le trajet qui rend stationnaire \(\int_{y_\text{A}}^{y_\text{B}}f(y,x(y),x'(y))\, \mathrm{d}y\) avec \(f(y,x,x')=n(y)\sqrt{1+{x'}^2}\). L'équation d'Euler-Lagrange donne \[ \frac{\partial f}{\partial x}=\frac{\mathrm{d}}{\mathrm{d}y}\left(\frac{\partial f}{\partial x'}\right) \quad\text{c'est-à-dire}\quad 0=\frac{\mathrm{d}}{\mathrm{d}y}\left(\frac{n\, x'}{\sqrt{1+{x'}^2}}\right) \] on en déduit \[ \frac{n\, x'}{\sqrt{1+{x'}^2}}=a \quad\text{avec}\quad a=\mathrm{C^{te}} \] On notera que la constante d'intégration \(a\) représente l'indice de réfraction au sommet de la courbe \(\mathcal{C}\) (lorsque \(x'\to \pm\infty\)). Si l'on note \((x_0,y_0)\) les coordonnées du sommet, on a donc \(a=n(y_0)\). Séparons maintenant les variables : \[ \mathrm{d}x=\frac{\pm a}{\sqrt{n^2-a^2}}\, \mathrm{d}y \] Prolongeons le calcul en choisissant un modèle d'atmosphère. Pour simplifier notre propos, adoptons un modèle linéarisé de \(n^2\) : \[ n^2=a^2+\alpha(y-y_0) \quad\text{avec}\quad \alpha>0 \] En substituant dans l'équation différentielle, on trouve \[ \int_{x_0}^x \mathrm{d}x=\pm \frac{a}{\sqrt{\alpha}} \int_{y_0}^y \frac{\mathrm{d}y}{\sqrt{y-y_0}} \] L'intégrale se calcule aisément ; on obtient \(x-x_0=\pm 2a\sqrt{y-y_0}/\sqrt{\alpha}\). Élevant au carré, on aboutit à l'équation du rayon lumineux : \[ y=y_0+\frac{\alpha}{4a^2}(x-x_0)^2 \] Le rayon lumineux adopte donc une trajectoire parabolique dont la courbure est d'autant plus prononcée que le gradient d'indice est important.

Exemple 2 : mirage gravitationnel

On peut montrer, à partir des équations de la Relativité Générale, que la présence d'un champ de gravitation déforme l'espace temps et allonge la durée d'un trajet lumineux par rapport au trajet dans un espace . Plus précisément, en présence d'un astre à symétrie sphérique de masse \(M\), le temps que met la lumière pour aller d'un point A vers un point B vaut \[ T_\text{AB}=\frac{1}{c}\int_\text{A}^\text{B} \left(1-\frac{2\phi}{c^2}\right)\,\mathrm{d}s \quad\text{avec}\quad \phi=-\frac{\mathcal{G}M}{r} \] où \(\phi\) désigne le potentiel gravitationnel et \(r\) la distance entre l'astre et un point du rayon lumineux. Ainsi, tout se passe comme si la présence d'un astre modifiait l'indice de réfraction de l'espace. On peut écrire \[ n(r)=1-\frac{2\phi}{c^2}=1+\frac{2\mathcal{G}M}{rc^2} \] Notez que le terme \(2\mathcal{G}M/(rc^2)\) est très faible pour une étoile. Par exemple, à la surface du Soleil ce terme vaut environ 4.10^-6. Il existe donc au voisinage des étoiles un faible gradient d'indice qui courbe les rayons lumineux. Ce phénomène, prévu dès 1915 par A. Einstein, fut observé la première fois par Eddington en 1919 lors d'une éclipse solaire.

Déviation d'un rayon lumineux au voisinage d'un astre massif.

Cherchons à déterminer l'angle de déviation \(\theta\) que subit un rayon lumineux au passage d'un astre de masse \(M\) à partir de l'équation(1). On a \[ \overrightarrow{\text{grad}}n= \frac{\mathrm{d}}{\mathrm{d}s}\left(n\overrightarrow{u}\right) \quad\Longrightarrow\quad \left[n\overrightarrow{u}\right]_\text{A}^\text{B}=\int_\text{A}^\text{B} \overrightarrow{\text{grad}}n\, \mathrm{d}s \] Prenons deux points A et B suffisamment éloignés de l'astre pour considérer que \(n=1\) en ces points. De plus, une construction géométrique (Fig.10) fait apparaître que \[ \left\|\overrightarrow{u}_\text{B}-\overrightarrow{u}_\text{A}\right\|=2\sin\frac{\theta}{2}\simeq \theta \] Par ailleurs, \(\overrightarrow{\text{grad}}n=-\frac{2}{c^2}\overrightarrow{\text{grad}}\phi\) de sorte que l'on trouve, pour les faibles déviations \[ \theta\simeq \frac{2}{c^2}\left\|\int_\text{A}^\text{B} \overrightarrow{\text{grad}}\phi\, \mathrm{d}s \right\| \] Cette relation ne nous aide pas beaucoup car l'intégrale nécessite de connaitre l'équation du rayon. Cependant, puisque \(2\phi/c^2 \ll 1\), on s'attend à ce que la déviation soit faible. On peut donc procéder à l'approximation de Born, couramment utilisée en théorie de la diffusion, qui consiste à intégrer sur le chemin non perturbé, c'est-à-dire ici la ligne droite. Ce rayon non perturbé passe à la distance \(b\) de l'astre. Le calcul de l'intégrale donne alors \[ \begin{array}{rcl} \displaystyle{\int_{-\infty}^{\infty}\overrightarrow{\text{grad}}\phi\, \mathrm{d}s} &= &\displaystyle{\int_{-\infty}^{\infty} -\dfrac{\mathcal{G}M}{r^3}\overrightarrow{r}\mathrm{d}s}\\[3mm] &= &\displaystyle{\int_{-\infty}^{\infty} -\dfrac{\mathcal{G}M}{(b^2+s^2)^{3/2}}(b \overrightarrow{u}_\perp+s\overrightarrow{u})\,\mathrm{d}s}\\[3mm] &= &\displaystyle{\int_{-\infty}^{\infty} -\dfrac{\mathcal{G}M}{(b^2+s^2)^{3/2}}(b \overrightarrow{u}_\perp)\,\mathrm{d}s}\\[3mm] &= &-\mathcal{G}Mb\,\overrightarrow{u}_\perp \displaystyle{\left[\dfrac{s}{b^2(b^2+s^2)^{1/2}}\right]_{-\infty}^{\infty}}\\[3mm] \displaystyle{\int_{-\infty}^{\infty}\overrightarrow{\text{grad}}\phi\, \mathrm{d}s} &= &-\dfrac{2\mathcal{G}M}{b}\,\overrightarrow{u}_\perp \end{array} \]

Schéma correspondant au calcul de la déviation. — Schéma correspondant au calcul de l'angle \(\theta\).

\begin{equation} \fcolorbox{#FFFFFF}{#FFF8F0}{\quad \(\displaystyle \theta=\frac{4\mathcal{G}M}{b\,c^2} \notag \)\quad} \end{equation}

Cet angle vaut 1,75" pour un rayon rasant le Soleil ; résultat qui fut confirmé en 1919 par Eddington. Une conséquence immédiate est que si l'alignement A-B passe par le centre de l'étoile, on s'attend à observer, par symétrie de révolution, un anneau lumineux dit anneau d'Einstein. En 1936, Albert Einstein publia un article[3]dans lequel il émettait des réserves sur notre capacité à observer ce type de .

Anneau d'Einstein capturé par le téléescope spatial Hubble — Anneau d'Einstein presque complet suite à l'effet mirage produit par une galaxie rouge sur une galaxie lointaine bleu. © ESA-Hubble-NASA.

En revanche, si le centre de l'astre déflecteur n'est pas dans l'alignement, le phénomène de déflexion gravitationnelle fait apparaître deux images (dues aux rayons passant par dessus et par dessous), en plus de l'image due au trajet direct (visible si l'astre déflecteur est transparent). C'est d'abord ce type de mirage que l'on découvrit en premier. En effet, en 1979, l'équipe qui étudiait le quasar double Q0957+561 s'aperçut qu'il s'agissait, en réalité, d'un seul et même quasar dédoublé à cause de la présence d'une grosse galaxie située sur la ligne de visée.

Depuis, de nombreux mirages gravitationnels furent observés. De nos jours, ces effets dit de lentille gravitationnelle sont couramment utilisés pour sonder le cosmos et même pour détecter des exoplanètes.

Il est d'usage de parler d'effet de lentille gravitationnelle (gravitational lens effect) bien que, contrairement aux lentilles, ces systèmes gravitationnels ne présentent pas de foyers.

Pour en savoir plus...

J-L Basdevant Le principe de moindre action et les principes variationnels en physiqueParis, Vuibert, 2010.
J. Roussel Cinématique du point matériel[en ligne], 2014. Disponible sur femto-physique.fr
A. Einstein Lens-like action of a star by the deviation of light in the gravitational field Sciencevol. 84, №2188, p.506-507, 1936.
M. Born et al. Principles of optics: electromagnetic theory of propagation, interference and diffraction of light 2000.
M.J. Nandor et al. Fermat’s principle and multiple imaging by gravitational lenses American Journal of Physicsvol. 64, №1, p.45-49, 1996.