F

MENUCours d'Optique

Ce chapitre s'intéresse à la diffraction en champ lointain, dite diffraction de Fraunhofer. Après quelques précisions sur ses conditions d'observation, nous montrons comment elle joue un rôle dans la formation des images par un système stigmatique. Enfin, nous voyons comment la prise en compte de la diffraction modifie les résultats du chapitre sur les réseaux de diffraction[1].

Diffraction en champ lointain

Approximation de Fraunhofer

Éclairons une pupille diffractante par une onde plane en incidence normale, puis observons la lumière diffractée sur un écran. À partir d'une certaine distance, la figure de diffraction présente un motif unique qui se contente de se dilater au fur et à mesure qu'on éloigne l'écran d'observation. C'est ce type de diffraction que l'on appelle diffraction de Fraunhofer.

Plaçons-nous dans le contexte du chapitre précédent : une onde plane en incidence normale arrive sur une pupille plane diffractante (S) placée en \(z=0\). On observe la répartition de l'intensité lumineuse sur un écran plan placé à la distance \(z\) de l'obstacle. Les notations sont les mêmes : P(\(x,y,0\)) repère un point de la pupille diffractante, et M(\(x',y',z\)) un point de l'écran d'observation.

Paramétrage du problème de diffraction en champ lointain
Paramétrage du problème de diffraction en champ lointain.

L'approximation de Fraunhofer consiste à se placer dans l'approximation paraxiale (\(x',y'\ll z\)) et en champ lointain (\(z\gg x,y\)). Reprenons l'expression de l'onde diffractée prévue par la théorie d'Huygens-Fresnel : \[ \underline{\psi}(\text{M})= \frac{i}{\lambda}\iint_{(S)}\underline{\psi}(\text{P})\frac{\mathrm{e}^{-i\, kr}}{r}\, \mathrm{d}x \mathrm{d}y \quad\text{avec}\quad r=\text{PM} \] expression dans laquelle le facteur d'obliquité est pris égal à 1 car les rayons issus de P et arrivant en M sont peu inclinés par rapport à l'axe (O\(z\)). Repérons le point M à l'aide des deux angles \(\theta_x\) et \(\theta_y\) que forme (OM) avec l'axe (O\(z\)) (Fig.1) : \[ \sin\theta_x=\frac{x'}{\text{OM}} \quad\text{et}\quad \sin\theta_y=\frac{y'}{\text{OM}} \]

Comme l'observation se fait à grande distance, \(r\) varie peu quand P parcourt le domaine d'intégration, de sorte que l'on peut approcher \(1/r\) par \(1/\text{OM}\). En revanche, pour le terme de phase \(kr\) il faut être plus précis, car lorsque P parcourt la surface diffractante, il suffit que la distance \(r\) varie de \(\lambda/2\) pour que le terme \(\mathrm{e}^{-i\, kr}\) change de signe. On a \[ \overrightarrow{r}= \overrightarrow{\text{PM}}=\overrightarrow{\text{OM}}-\overrightarrow{\text{OP}} \quad\text{d'où}\quad r^2\simeq \text{OM}^2-2 \overrightarrow{\text{OM}}\cdot \overrightarrow{\text{OP}}+{\text{OP}}^2 \] Utilisons l'approximation \(\sqrt{1-\epsilon}\simeq 1-\epsilon/2\), puis gardons seulement les termes d'ordre un en \(x\) et \(y\). On aboutit à \[ r\simeq \text{OM}-\frac{\overrightarrow{\text{OM}}\cdot\overrightarrow{\text{OP}}}{\text{OM}}= \text{OM}-x\sin\theta_{x}-y\sin\theta_{y} \] L'onde diffractée en champ lointain s'écrit donc

Diffraction en champ lointain

\begin{equation} \underline{\psi}(\text{M}) \simeq\frac{i}{\lambda}\frac{\mathrm{e}^{-ik\text{OM}}}{\text{OM}} \iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y \end{equation}

Une fois ce calcul effectué, on obtient l'intensité lumineuse en prenant le carré du module de \(\underline{\psi}(\text{M})\). En pratique, on s'intéresse aux variations d'intensité dans le plan d'observation. C'est pourquoi, on se contente souvent de calculer l'intégrale de l'équation (1) puisque le terme multiplicateur est constant en module (\(1/\text{OM}\simeq 1/z\)) : \[ I(\text{M})\propto \left|\iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y\right|^2 \]

Cette dernière relation montre que la répartition de l'intensité dépend de la position de M via uniquement les variables \(\sin\theta_x\) et \(\sin\theta_y\). En d'autres termes, on a \[ I(x',y',z)\propto f(x'/z,y'/z) \] ce qui signifie que lorsque \(z\) augmente d'un certain facteur (on recule le capteur), le motif de diffraction subit une dilatation de ce même facteur. Finalement, si on oublie un instant le fait que l'intensité diminue au fur et à mesure que l'on s'éloigne de la pupille diffractante, la tache de diffraction conserve sa forme au facteur de dilatation près.

Conditions expérimentales

Le montage le plus simple consiste à placer une source ponctuelle au foyer d'une lentille mince de façon à former une onde plane. On interpose ensuite la pupille diffractante à étudier, puis on recueille la lumière diffractée sur un écran placé suffisamment loin. On cherche ici à préciser ce dernier point.

Montage expérimental
Observation de la diffraction dans le cadre de l'approximation de Fraunhofer.

Reprenons le raisonnement de la section précédente : \[ \overrightarrow{r}=\overrightarrow{\text{PM}}=\overrightarrow{\text{OM}}-\overrightarrow{\text{OP}} \quad\text{soit}\quad r=\text{OM}\sqrt{1+\frac{\text{OP}^2-2 \overrightarrow{\text{OM}}\cdot \overrightarrow{\text{OP}}}{\text{OM}^2}} \] L'approximation de Fraunhofer consiste à négliger l'influence du terme quadratique dans \(\mathrm{e}^{ikr}\), ce qui suppose \[ \frac{\text{OP}^2}{\text{OM}}\ll \lambda \quad \forall \text{P}\in \text{(S)} \] Dans les conditions paraxiales on a \(\text{OM}\simeq z\), et si l'on note \(a\) la taille caractéristique de la pupille diffractante, l'approximation de Fraunhofer est valide à condition que

Conditions de validité de la diffraction de Fraunhofer

\[ z\gg \frac{a^2}{\lambda} \]

Finalement, on peut séparer le champ de diffraction en trois zones, chaque zone correspondant à un niveau d'approximation différent (Tab.1).

Les différents niveaux d'approximation.
Distance pupille-écran\(z \sim \lambda\)\(z\gg \lambda\)\(z \gg \lambda\) et \(z \gg a^2/\lambda\)
Théorie valideMaxwellHuygens-FresnelFraunhofer

En pratique, il faut placer l'écran de diffraction assez loin pour que l'approximation de Fraunhofer soit valide. En lumière rouge (\(\lambda\sim 1\,\mathrm{\mu m}\)), on trouve \[ \begin{array}{lcl} \text{pour } a=1\,\mathrm{cm} &\rightarrow&z\gg 100\,\mathrm{m}\\ \text{pour } a=1\,\mathrm{mm} &\rightarrow&z\gg 1\,\mathrm{m}\\ \text{pour } a=100\,\mathrm{\mu m} &\rightarrow&z\gg 1\,\mathrm{cm} \end{array} \] Cette contrainte s'accompagne d'une baisse de luminosité du phénomène. En effet, d'après la relation (1), l'intensité au centre de l'écran est donnée par \[ I(0,0,z)=\frac{\mathcal{A}^2}{\lambda^2\, z^2}I_0\ll I_0 \] où \(I_0\) est l'intensité de la lumière incidente et \(\mathcal{A}\) l'aire de la pupille diffractante. Par exemple, pour un trou de rayon \(a\sim 1\,\mathrm{mm}\), on choisira \(z\sim 10\,\mathrm{m}\), et l'intensité au centre de l'écran sera de l'ordre de \(I\sim I_0/100\). La faible luminosité du phénomène impose souvent l'utilisation d'un laser.

Dispositif d'observation de la diffraction de Fraunhofer
Dispositif d'observation de la diffraction de Fraunhofer.

Une autre méthode d'observation consiste à interposer entre la pupille diffractante et l'écran, une lentille convergente, puis à placer l'écran dans le plan focal image de la lentille. Ce montage présente l'avantage d'être plus intense et moins encombrant que la première méthode. Les rayons qui se croisent dans le plan focal sont issus de rayons diffractés parallèles entre eux, c'est-à-dire des rayons qui se couperaient à l'infini en l'absence de lentille. Par conséquent, les conditions de Fraunhofer sont de facto remplies. Les relations de passage entre \((x',y')\) et \((\theta_{x},\theta_{y})\) sont, dans l'approximation paraxiale (petits angles) : \[ \sin\theta_{x}\simeq\frac{x'}{f'} \quad\text{et}\quad \sin\theta_{y}\simeq\frac{y'}{f'} \] avec \(f'\) la distance focale image de la lentille convergente. Ainsi, avec ce montage, la répartition de l'intensité lumineuse est donnée par

\begin{equation} I(x',y',L+f')=\frac{1}{\lambda^2 f'^2}\left| \iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(xx'+yy')/f'}\, \mathrm{d}x \mathrm{d}y \right|^2 \end{equation}

Cette relation a le mérite d'être . Notez que la distance \(L\) entre la pupille diffractante et la lentille ne joue aucun rôle sur la tache de diffraction observée dans le plan focal.

En résumé

L'approximation de Fraunhofer consiste à se placer dans l'approximation paraxiale (\(\theta_x,\theta_y \ll 1\)) et en champ lointain (\(z\gg a^2/\lambda\)). Dans ce cadre, l'intensité de la lumière diffractée vaut \[ I(\text{M})\simeq\frac{1}{z^2\lambda^2} \left|\iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y\right|^2 \quad\text{avec}\quad k=\frac{2\pi}{\lambda} \] Cette dernière relation devient exacte si l'on observe la lumière dans le plan focal d'une lentille. Il suffit de remplacer \(z\) par la distance focale image \(f'\).

Diffraction par une pupille rectangulaire

Considérons une pupille rectangulaire de largeur \(2a\) suivant (O\(x\)) et de longueur \(2b\) suivant (O\(y\)).

Pupille rectangulaire
Pupille rectangulaire.

Envoyons une onde plane en incidence normale sur la pupille diffractante. L'état vibratoire dans le plan de la pupille rectangulaire s'écrit \[ \underline{\psi}(\text{P})= \begin{cases} \psi_0 & \text{ si } |x|<a \quad\text{et}\quad |y|<b \\ 0 & \text{ sinon.} \end{cases} \] où \(\psi_0\) est une amplitude constante. L'onde diffractée à l'infini dans la direction donnée par \(\theta_x\) et \(\theta_y\) s'écrit donc \[ \underline{\psi}(\theta_x,\theta_y)=\frac{i \psi_0}{\lambda}\frac{\mathrm{e}^{-ik\text{OM}}}{\text{OM}} \int_{-b}^{b}\mathrm{e}^{ik(y\sin\theta_{y})}\, \mathrm{d}y \int_{-a}^{a}\mathrm{e}^{ik(x\sin\theta_{x})}\, \mathrm{d}x \] relation qui fait intervenir l'intégrale \[ \int_{-x_0}^{x_0}\mathrm{e}^{i\alpha x}\,\mathrm{d}x = \left[\frac{1}{i\,\alpha}\mathrm{e}^{i\alpha x}\right]_{-x_0}^{x_0}= 2x_{0}\,\mathrm{sinc}(\alpha x_{0}) \] où l'on a défini la fonction sinus cardinal : \(\mathrm{sinc}(x)\stackrel{\text{def}}= \frac{\sin(x)}{x}\) (Fig.5).

Graphes de la fonction sinus cardinal et de son carré
Graphes de la fonction sinus cardinal et de son carré.

Ainsi, on obtient \[ \underline{\psi}(\theta_{x},\theta_{y})= i\psi_0\frac{4ab}{\lambda\text{OM}}\mathrm{e}^{-ik\text{OM}}\, \mathrm{sinc}\left(\frac{2\pi a\sin\theta_{x}}{\lambda}\right)\,\mathrm{sinc}\left(\frac{2\pi b\sin\theta_{y}}{\lambda}\right) \] et l'intensité lumineuse vaut

\begin{equation} I(\theta_{x},\theta_{y})= I_\text{max}\left[\mathrm{sinc}\left(\frac{2\pi a\sin\theta_{x}}{\lambda}\right) \mathrm{sinc}\left(\frac{2\pi b\sin\theta_{y}}{\lambda}\right)\right]^{2} \end{equation}

avec \(I_\text{max}\) l'intensité lumineuse le long de l'axe optique (\(\theta_x=\theta_y=0\)). La figure 6 montre le motif recueilli sur un écran situé dans la zone de Fraunhofer (\(z\gg \text{max}(a^2,b^2)/\lambda\)). On peut voir qu'il existe des lignes d'intensité nulle correspondant à l'annulation de l'un des deux sinus cardinaux. Notez que la figure de diffraction présente une symétrie quadratique comme la pupille. Les éléments de symétrie de la pupille se retrouvent dans la figure de diffraction comme le veut le principe de Curie.

Diffraction par une pupille rectangulaire
Pupille diffractante (à gauche) et tache de diffraction (à droite). Simulation réalisée pour \(\lambda=700\,\mathrm{nm}\), \(a=0{,}56~\mathrm{mm}\), \(b=3a\) et \(z=7~\mathrm{m}\).

Alors que l'optique géométrique prévoit une tache rectangulaire en vertu de la propagation rectiligne de la lumière, la prise en compte de la diffraction fait apparaître une tâche centrale de diffraction beaucoup plus large que l'image géométrique. En effet, la tache centrale est localisée dans un espace angulaire caractérisé par \[ \left|\sin\theta_{x}\right|<\frac{\lambda}{2a} \quad\text{et}\quad \left|\sin\theta_{y}\right|<\frac{\lambda}{2b} \] Dans l'approximation paraxiale, on peut approcher \(\sin\theta_x\) et \(\sin\theta_y\) par respectivement \(x'/z\) et \(y'/z\). Aussi la tache principale de diffraction est localisée dans la zone d'espace définie par \[ |x'|<a'=\frac{z\lambda}{2a} \quad\text{et}\quad |y'|<b'=\frac{z\lambda}{2b} \] Dans la zone de Fraunhofer (\(z\gg \text{max}(a^2,b^2)/\lambda\)), on a nécessairement \(a'\gg a\) et \(b'\gg b\).

Si \(a\) diminue, le motif de diffraction s'élargit suivant (O\(x'\)), et si \(b\) diminue il s'élargit suivant (O\(y'\)). On peut montrer que la tache centrale concentre la majeure partie de l'éclairement lumineux (environ 80%). On observe également des « tâches satellites » beaucoup moins intenses (\(I<5\%\,I_\text{max}\)) dont l'intensité décroît rapidement au fur et à mesure qu'on s'éloigne du centre.

En conclusion, le phénomène de diffraction de la lumière par une ouverture rectangulaire est, dans l'approximation de Fraunhofer, d'autant plus prononcé que l'ouverture est étroite. Le motif de diffraction fait apparaître une tache centrale qui concentre l'essentiel de l'énergie lumineuse, et qui se situe dans un espace angulaire donné par

Angles de diffraction

\[ \left|\sin\theta_{x}\right|<\frac{\lambda}{2a} \quad\text{et}\quad \left|\sin\theta_{y}\right|<\frac{\lambda}{2b} \]

Diffraction par une fente

Le cas de la fente fine s'obtient en faisant tendre \(b\) vers l'. En vertu de ce que l'on a vu sur la pupille rectangulaire, on prévoit un éparpillement de la lumière selon (O\(x'\)), et quasiment pas verticalement. Intéressons-nous donc à la répartition de l'intensité lumineuse en \(y'=0\). En reprenant la formule (3), il vient

\begin{equation} I(\theta_{x},\theta_{y}=0)=I_\text{max}\left[\mathrm{sinc}\left(\frac{2\pi a\sin\theta_{x}}{\lambda}\right)\right]^{2} \end{equation}
Diffraction par une fente
Diffraction par une fente dans le plan \(z=10^7\,\lambda\). La simulation montre l'influence de la largeur sur le diffractogramme.

On représente souvent cette distribution d'intensité en coordonnées polaires. On obtient alors l'indicatrice de diffraction d'une fente. Cette indicatrice fait apparaître un lobe principal de diffraction (la tache centrale) et des lobes secondaires d'intensités décroissantes (Fig.8).

Indicatrice de diffraction
Indicatrice de diffraction dans le plan (\(x\)O\(z\)) pour \(2a=3\lambda\).

Formation des images

Image d'un point source

Considérons le montage classique de la projection d'un point source sur un écran à l'aide d'une lentille mince convergente L. Plaçons un diaphragme juste devant la lentille. En vertu des lois de l'optique géométrique, et en supposant la lentille exempte de tous défauts (chromatiques et géométriques), on s'attend à observer une image réelle ponctuelle A' sur l'écran. Toutefois, on sait que la lumière qui arrive sur le diaphragme est diffractée de sorte que tous les rayons ne convergent pas en A'. On peut légitimement se demander quelle est la répartition de l'intensité lumineuse lorsque l'on tient compte du phénomène de diffraction.

Équivalence des deux montages
Équivalence des deux montages.

Pour cela, on peut toujours remplacer la lentille L par deux lentilles L\(_1\) et L\(_2\), accolées, telles que A' se situe dans le plan focal image de L\(_2\) et A dans le plan focal objet de L\(_1\) (Fig.9). Dans ce cas, L\(_1\) permet d'envoyer une onde plane en incidence normale sur le diaphragme et L\(_2\) fait interférer tous les rayons émergeants du diaphragme à l'infini en les projetant dans son plan focal. On retrouve donc un montage équivalent à celui de la figure 3. Ainsi, la répartition de la lumière sur l'écran est donnée par la diffraction de Fraunhofer. On retiendra donc que lorsqu'une lentille conjugue un plan objet avec un plan image, tout point objet donne naissance à la figure de diffraction de Fraunhofer du diaphragme placé juste avant (ou juste après) la lentille.

C'est ce qui explique que la diffraction de Fraunhofer joue un rôle capital dans la formation des images. Du point de vue mathématique, l'intensité lumineuse enregistrée sur l'écran est donnée par la formule (4) où \(f'\) est à remplacer par la distance \(d'=\text{OA}'\) : \[ I(x',y',d')=\frac{1}{\lambda^2 d'^2}\left| \iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(xx'+yy')/d'}\, \mathrm{d}x \mathrm{d}y \right|^2 \] Notez que cette formule est exacte et aucune condition sur \(d'\) n'est requise. Nul besoin de choisir de grandes focales, ce qui permet d'avoir un phénomène lumineux. En revanche, la taille de la tache de diffraction est d'autant plus petite que \(d'\) est petit.

À retenir

L'image d'un point A par une lentille est une tache de diffraction centrée sur l'image A' prévue par l'optique géométrique. Cette tache de diffraction est donnée par la diffraction de Fraunhofer du diaphragme placé devant la lentille.

Cas d'un diaphragme circulaire

Le montage typique de la formation des images en éclairage incohérent est constitué d'un système convergent limité par une pupille circulaire. Chaque point objet a pour image une tache de diffraction centrée sur l'image géométrique. Pour simplifier, nous allons considérer un point A sur l'axe optique et déterminer la répartition de l'intensité sur le plan conjugué par une lentille mince. On note \(a\) le rayon de la pupille et \(d'\) la distance entre la lentille et l'écran d'observation.

Remarque

Le calcul est un peu technique. Pour une première lecture on peut aller directement au résultat (5).

On sait que la répartition de l'intensité est donnée par la diffraction de Fraunhofer : \[ I(\theta_x,\theta_y)=\frac{1}{\lambda^2 d'^2}\left| \iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{ik(x\sin\theta_x+y\sin\theta_y)}\, \mathrm{d}x \mathrm{d}y \right|^2 \] Le calcul est simplifié quand on exploite la symétrie de révolution du problème. Repérons donc P et M par leurs coordonnées polaires \((\rho,\varphi)\) et \((\rho',\varphi')\). L'élément de surface en coordonnées polaires s'écrit \( \mathrm{d}x\, \mathrm{d}y=\rho \mathrm{d}\rho \mathrm{d}\varphi\). Par ailleurs, vu la symétrie, il est intéressant de définir l'angle de diffraction \(\theta\) que forme (OM) avec l'axe (O\(z\)).

Pupille circulaire
Pupille circulaire.

Cet angle est relié aux « angles cartésiens » par \[ \sin\theta=\frac{\rho'}{\text{OM}} \quad;\quad \sin\theta_x=\sin\theta\cos\varphi' \quad;\quad \sin\theta_y=\sin\theta\sin\varphi' \] de sorte que \[ x\sin\theta_x+y\sin\theta_y= \rho\sin\theta(\cos\varphi\cos\varphi'+\sin\varphi\sin\varphi')= \rho\sin\theta\cos(\varphi-\varphi') \] On ré-exprime ainsi l'intensité lumineuse : \[ I(\theta)=\frac{1}{\lambda^2 d'^2}\left| \int_{\rho=0}^a\int_{\varphi=0}^{2\pi}\psi_0\,\mathrm{e}^{ik\rho\sin\theta\cos(\varphi-\varphi')}\, \rho\mathrm{d}\rho \mathrm{d}\varphi \right|^2 \] Comme on l'a dit, la symétrie de révolution implique l'invariance de l'intensité par rapport à \(\varphi'\). C'est-pourquoi on peut imposer \(\varphi'=0\) pour simplifier le calcul : \[ I(\theta)=\frac{I_0}{\lambda^2 d'^2}\left| \int_{0}^a \rho\mathrm{d}\rho \underbrace{\int_{0}^{2\pi}\mathrm{e}^{ik\rho\sin\theta\cos\varphi}\, \mathrm{d}\varphi}_{2\pi \mathrm{J_0}(k\rho\sin\theta)} \right|^2 \] La dernière intégrale fait intervenir la fonction de Bessel d'ordre 0, notée \(\mathrm{J_0}\), définie par \[ \mathrm{J_0}(x)=\frac{1}{2\pi}\int_0^{2\pi}\mathrm{e}^{(i x\cos\varphi)}\,\mathrm{d}\varphi \] Posons \(x=k\rho\sin\theta\) puis choisissons \(x\) comme variable d'intégration : \[ I(\theta)=\frac{I_0}{\lambda^2 d'^2}\left| \int_{0}^{ka\sin\theta} x\mathrm{J_0}(x)\, \mathrm{d}x \times \frac{2\pi}{k^2\sin^2\theta} \right|^2 \] Par définition, la fonction de Bessel d'ordre 1, notée \(\mathrm{J_1}\), est reliée à \(\mathrm{J_0}\) via \[ x \mathrm{J_0}(x)=\frac{\mathrm{d}(x\mathrm{J_1}(x))}{\mathrm{d}x} \] Finalement, on trouve

\begin{equation} I(\theta)=I_\text{max}\left(\frac{2\mathrm{J_1}(ka\sin\theta)}{ka\sin\theta}\right)^2 \quad\text{avec}\quad I_\text{max}=I_0\left(\frac{\pi a^2}{\lambda d'}\right)^2 \end{equation}
Pupille circulaire
Profil d'intensité de la tache de diffraction par une pupille circulaire.

L'évolution de l'intensité avec \(\sin\theta\) est représentée sur la figure 11 dans l'espace \((\sin\theta_x,\sin\theta_y)\) équivalent —à un facteur d'échelle près et dans l'approximation paraxiale— au plan d'observation. On peut remarquer que l'essentiel de l'énergie lumineuse se concentre dans une tache centrale circulaire que l'on appelle tache d'Airy. Cette dernière est entourée d'anneaux de diffraction moins intenses (\(I<2\%\)). Le premier anneau sombre est donné par l'annulation de \(\mathrm{J_1}(ka\sin\theta)\) et correspond à \(ka\sin\theta=1{,22\pi}\). Il vient donc que la lumière diffractée se concentre dans un cône tel que

Angle de diffraction par une pupille circulaire de rayon \(a\)

\[ |\sin\theta|\simeq |\theta| < 1,22\frac{\lambda}{2a} \]

Ce cône produit une tache centrale de diamètre \[ \phi\simeq1{,}22\,\frac{\lambda d'}{a} \] Ainsi, contrairement aux lois de l'optique géométrique, même dans le cadre des rayons paraxiaux, l'image d'un point n'est pas un point mais une tache de diffraction dont la dimension et l'intensité sont de l'ordre de \[ \phi\sim \frac{\lambda d'}{a} \quad\text{et}\quad I\sim I_0\left(\frac{\pi a^2}{\lambda d'}\right)^2 \] Par exemple, prenons un montage \(2f'-2f'\) avec \(f'=50\,\mathrm{cm}\), limité par un diaphragme circulaire de rayon \(a=5\,\mathrm{cm}\). L'écran d'observation est placé à la distance \(d'=2f'=1\,\mathrm{m}\). D'après nos calculs, l'image d'un point lumineux (\(\lambda\sim 500\,\mathrm{nm}\)) est une tache dont l'essentiel de l'énergie se trouve dans un disque de diamètre et d'intensité de l'ordre de \[ \phi\sim 10\,\mathrm{\mu m} \quad\text{et}\quad I\sim I_0\left(\frac{\pi a^2}{\lambda d'}\right)^2\sim 10^8\,I_0 \] alors que l'optique géométrique prévoit \(\phi=0\) et \(I=\infty\). La tache est quasi ponctuelle mais reste de taille non nulle. Cette limite contraint le résolution des appareils optiques comme nous allons le voir.

Résolution angulaire limite

Le pouvoir de résolution d'un instrument d'optique est sa capacité à différencier deux objets ponctuels. On définit la résolution angulaire \(\delta \theta\) comme la séparation angulaire minimale entre deux sources ponctuelles que l'instrument peut différencier.

De nombreux facteurs limitent le pouvoir de résolution d'un instrument d'optique : aberrations chromatiques et géométriques, granularité du capteur, turbulence atmosphérique, etc. Cependant, il existe une limite théorique à la résolution d'un appareil due au phénomène de diffraction. En effet, comme on vient de le voir, un système optique ne peut pas donner d'un objet ponctuel une image ponctuelle à cause de la diffraction par le diaphragme limitant l'extension du faisceau.

Deux étoiles résolues par l'objectif d'une lunette
Deux étoiles résolues par l'objectif d'une lunette.

Pour illustrer notre propos, traitons le cas de la lunette astronomique. Imaginons que l'objectif d'une lunette —assimilée à une lentille mince limitée par un diaphragme circulaire de rayon \(a\)—vise deux points A et B. Compte tenu du phénomène de diffraction, A et B sont transformés par l'objectif en deux taches d'Airy centrées sur leur image géométrique A' et B'. On dit que le système optique résout les deux points, c'est-à-dire sépare les deux points, lorsque les taches d'Airy sont suffisamment séparées. Un critère largement utilisé, dit critère de Rayleigh, stipule que deux points images sont résolus quand leur séparation est plus grande que la demi-largeur de la tache d'Airy, ce qui se traduit par la condition

\begin{equation} \theta > 1{,}22\,\frac{\lambda}{2a}=\delta\theta \end{equation}

Deux étoiles séparées d'un angle inférieur à \(\delta\theta\) ne pourront pas être séparées par l'instrument. Ce résultat est également valable dans le cas des télescopes. Pour atteindre de très bonnes résolutions angulaires, on a donc intérêt à augmenter la taille de la pupille d'entrée de l'instrument. En réalité, l'augmentation du diamètre des télescopes permet surtout de gagner en luminosité, car le phénomène de turbulence atmosphérique introduit une limite de résolution souvent plus contraignante. Il faut alors, soit se défaire de la turbulence atmosphérique en envoyant les télescopes dans l'espace, soit utiliser des techniques de correction telle que l'optique adaptative, pour tenter d'approcher la limite donnée par (6).

Rayleigh
Critère de séparation de Rayleigh : deux tâches d'Airy séparées par une distance inférieure au rayon d'une tâche ne sont pas résolues.

Résolution spatiale d'un microscope

La résolution spatiale \(\delta\ell\) désigne la séparation spatiale minimale entre deux points objets que l'instrument arrive à différencier. Cette notion est d'importance en microscopie où le but premier est d'observer les plus petits détails possibles. Considérons donc l'objectif d'un microscope constitué d'une lentille convergente limitée par un diaphragme de rayon \(a\). Notons \(n\) l'indice de l'espace objet et \(n'\) celui de l'espace image. Deux points sources ont chacune pour image une tache d'Airy centrée sur leur image géométrique. Appelons \(d'\) la distance qui sépare le plan image du centre de la lentille.

Images données par un objectif de microscope
Images données par un objectif de microscope.

En terme spatial, le critère de Rayleigh donne \[ \mathrm{A'B'}>\frac12 \phi= 1{,}22\,\frac{\lambda' d'}{2a} \] où \(\lambda'\) est la longueur d'onde dans le milieu image. Si on note \(\lambda\) la longueur d'onde dans le vide de la radiation lumineuse, on a \(\lambda'=\lambda/n'\). Par ailleurs, définissons les angles \(\alpha\) et \(\alpha'\) que forment les rayons extrêmes par rapport à l'axe optique. Si l'on suppose la propriété d'aplanétisme vérifiée, la condition du sinus d'Abbe doit être remplie : \[ n \text{AB}\sin\alpha=n' \text{A'B'}\sin\alpha' \] La contrainte dans le plan image se ramène donc à une contrainte dans le plan objet donnée par \[ \mathrm{AB}>\frac{n'\sin\alpha'}{n\sin\alpha}\times 1{,}22\,\frac{\lambda d'}{2a\,n'} \] L'angle \(\alpha'\) est en général petit de sorte que \(\sin\alpha'\simeq a/d'\). Finalement, on trouve \[ \text{AB}>\frac{1{,}22\lambda}{2n\sin\alpha}=\delta \ell \] On obtient donc un bon pouvoir de résolution en choisissant une grande ouverture numérique \(n\sin\alpha\) et une petite longueur d'onde. Toutefois, dans le visible, on ne peut pas descendre en dessous de \(\lambda=400\,\mathrm{nm}\). En général, l'ouverture numérique étant de l'ordre de l'unité, on peut retenir que la résolution limite imposée par la diffraction est de l'ordre de \(\lambda/2\). Autrement dit, un microscope optique ne permet pas d'observer des détails plus petits que \(200\,\mathrm{nm}\).

Remarque

Il est possible de contourner la limite due à la diffraction en sondant l'onde diffractée évanescente au voisinage immédiat de l'échantillon à observer. On parle de microscopie en champ proche ou a sonde locale.

Retour sur les interférences

Revenons sur différents phénomènes d'interférence par division du front d'onde pour voir l'influence de la diffraction.

Fonction de transparence

Comme on l'a vu, le motif de diffraction de Fraunhofer est régi par l'équation \[ I(\text{M})\simeq\frac{1}{z^2\lambda^2} \left|\iint_{(S)}\underline{\psi}(\text{P})\,\mathrm{e}^{i\frac{2\pi}{\lambda}(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y\right|^2 \] où l'intégration s'effectue sur la surface de l'ouverture diffractante. Si l'on envoie une onde plane d'amplitude \(\psi_0\) en incidence normale, on a \(\underline{\psi}(\text{P})=\psi_0\) pour tout point P de l'orifice, et \(\underline{\psi}(\text{P})=0\) ailleurs. On peut aussi introduire la fonction de transparence \(t(x,y)\) définie par \[ \underline{\psi}(\text{P})=t(x,y)\,\psi_0 \] avec \(t(x,y)=0\) pour les parties opaques, et \(t(x,y)=1\) pour les parties transparentes.

Il arrive aussi que certaines parties transparentes introduisent des retards de phase variables d'un point à un autre. Dans ce cas, on définit une fonction de transparence complexe \[ \underline{t}(x,y)=t(x,y)\mathrm{e}^{-i\phi(x,y)} \] où \(\phi(x,y)\) est le retard de phase. Par exemple, on peut voir une lentille mince comme une pupille circulaire introduisant un retard de phase proportionnel à l'épaisseur de la lentille et à l'indice de réfraction.

Cette transparence étant définie en tout point du plan \(z=0\), la diffraction à l'infini se réduit à \[ I(\text{M})=\frac{I_0}{z^2\lambda^2} \left| \int_{-\infty}^\infty\int_{-\infty}^\infty \underline{t}(x,y)\, \mathrm{e}^{i\frac{2\pi}{\lambda}(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y \right|^2 \]

Théorème des réseaux

Traitons le cas général de \(N\) pupilles diffractantes identiques réparties sur un plan. La pupille \(\text{P}_{k\in\{1,\ldots,N\}}\) est placée en \((x_{k},y_{k})\). Si l'on définit la transparence d'une pupille placée en \((0,0)\) par \(\underline{t}(x,y)\), alors le réseau présente une transparence \[ \underline{t}_{N}(x,y)=\sum_{k}\underline{t}(x-x_{k},y-y_{k}) \] Éclairée par une onde plane en incidence normale, l'intensité de l'onde diffractée à l'infini dans la direction \((\theta_x,\theta_y)\) vaut \[ I_N(\theta_{x},\theta_{y})=\frac{I_0}{z^2\lambda^2}\left| \iint_{\text{réseau}}\underline{t}_{N}(x,y)\,\mathrm{e}^{i\frac{2\pi}{\lambda}(x\sin\theta_{x}+y\sin\theta_{y})}\, \mathrm{d}x \mathrm{d}y \right|^2 \] ce qui donne après le changement de variable \(u=x-x_{k}\) et \(v=y-y_{k}\) : \[ I_N(\theta_{x},\theta_{y})=\frac{I_0}{z^2\lambda^2}\left| \sum_{k}\iint\mathrm{e}^{i\frac{2\pi}{\lambda}(x_k\sin\theta_x+y_k\sin\theta_y)}\, \underline{t}(u,v)\mathrm{e}^{i\frac{2\pi}{\lambda}(u\sin\theta_x+v\sin\theta_y)}\, \mathrm{d}u \mathrm{d}v \right|^2 \] Le premier terme exponentiel ne dépend pas de \(u\) et \(v\) ce qui permet de le sortir de l'intégrale, laquelle ne dépend pas de \(k\). L'intégrale se factorise en deux termes : \[ I_N(\theta_{x},\theta_{y})=\frac{I_0}{z^2\lambda^2}\left| \iint\underline{t}(u,v)\mathrm{e}^{i\frac{2\pi}{\lambda}(u\sin\theta_x+v\sin\theta_y)}\, \mathrm{d}u \mathrm{d}v\right|^2 \times \left|\sum_k \mathrm{e}^{i\frac{2\pi}{\lambda}(x_k\sin\theta_x+y_k\sin\theta_y)}\right|^2 \] Le premier terme est tout simplement l'intensité \(I_1\) issue de la diffraction par une pupille centrée en O. Quant au second, il s'agit d'un terme d'interférence relié à la position relative des différentes pupilles. Finalement, l'intensité de l'onde diffractée à l'infini par un ensemble de \(N\) pupilles identiques est égale à

Théorème des réseaux

\[ I_N(\theta_x,\theta_y)= I_1(\theta_x,\theta_y)\times \left|\mathcal{F}_\text{I}\right|^{2} \quad\text{avec}\quad \mathcal{F}_\text{I}= \sum_{k}\mathrm{e}^{i\frac{2\pi}{\lambda}(x_{k}\sin\theta_{x}+y_{k}\sin\theta_{y})} \]

De manière générale, la diffraction à l'infini par un ensemble de \(N\) motifs diffractants se décrit comme le produit d'un terme de diffraction qui module un terme d'interférence. La position des pics d'interférence donne un renseignement sur la disposition des motifs diffractants alors que la modulation des pics donne un renseignement sur le motif diffractant. Cette propriété est générale. Par exemple, en radiocristallographie où l'on étudie la structure des cristaux par diffraction des rayons X, la position des pics de diffraction permet de remonter à la symétrie cristalline alors que la modulation des pics donne un renseignement sur le motif moléculaire (notamment son numéro atomique).

Retour sur l'expérience d'Young

Reprenons l'expérience des trous d'Young étudiée dans le cours sur les interférences à deux ondes [2]. Une source éclaire un écran percé de deux petits trous distants de \(a\). Si la source et l'écran d'observation sont suffisamment loin, on peut interpréter ce que l'on observe comme le résultat de la diffraction à l'infini d'une pupille diffractante constituée de deux trous circulaires. Notons \(a_0\) le rayon des deux trous.

pupille diffractante Intensité diffractée par deux trous d'Young dans l'approximation de Fraunhofer
À gauche : pupille diffractante. À droite : répartition de l'intensité dans l'approximation de Fraunhofer.

Comme on vient de le voir, la répartition de l'intensité lumineuse correspond à la tache de diffraction par un trou (une tache circulaire entourée d'anneaux) modulée par le carré du facteur d'interférence \[ \mathcal{F}_\text{I}=\sum_{k}e^{i\frac{2\pi}{\lambda}(x_{k}\sin\theta_{x}+y_{k}\sin\theta_{y})} \] Ici, on a une pupille P\(_1\) située en\((0,a/2)\) et une autre P\(_2\) en \((0,-a/2)\). Par conséquent, le terme d'interférence vaut \[ \mathcal{F}_\text{I}=e^{i\frac{\pi}{\lambda}(a\sin\theta_{y})}+e^{-i\frac{\pi}{\lambda}(a\sin\theta_{y})}= 2\cos\left(\frac{\pi a\sin\theta_y}{\lambda}\right) \] Les conditions expérimentales correspondent à l'approximation paraxiale de sorte que \(\sin\theta_y\simeq y'/D\). En utilisant l'identité \(\cos(2a)=2\cos^2 a-1\), on trouve \[ I_2(\text{M})=2I_1(\text{M})\left[1+\cos\left(\frac{2\pi a y'}{\lambda D}\right)\right] \quad\text{avec}\quad I_1(\text{M})=\mathrm{C^{te}}\left(\frac{2\mathrm{J_1}(ka_0\sin\theta)}{ka_0\sin\theta}\right)^2 \] On retrouve donc une modulation périodique verticale de la lumière avec un interfrange donné par \(\lambda D/a\). Toutefois, contrairement à ce que nous avons obtenu dans le cours sur les interférences à deux ondes[2], les franges ne sont visibles que dans le champ de diffraction d'une pupille (Fig.15).

Réseau de Fentes

Dans le cours sur les interférences à \(N\) ondes[1], on a montré que l'intensité diffractée dans la direction \(\theta_x\), par un réseau de fentes rectilignes périodiquement espacées, s'écrivait \[ I_N(\theta_x)=K\left[\frac{\sin\left(\frac{N\pi a}{\lambda}\sin\theta_x\right)} {\sin\left(\frac{\pi a}{\lambda}\sin\theta_x\right)}\right]^{2} \] où \(a\) est le pas du réseau. Ce résultat a été obtenu en admettant que les fentes diffractaient l'onde incidente de façon isotrope (\(K\) indépendant de \(\theta_x\)). En réalité il faut tenir compte du fait que l'amplitude diffractée varie avec \(\theta_x\).

En effet, pour une fente fine de largeur \(2a_0\) placée en (0,0), l'intensité diffractée vaut (cf. (12)) \[ I_1(\theta_{x})=I_0\left[\mathrm{sinc}\left(\frac{2\pi a\sin\theta_{x}}{\lambda}\right)\right]^{2} \] Quant au terme d'interférence, il s'écrit en prenant \(x_k=ka\) et \(y_k=0\) : \[ \mathcal{F}_\text{I}=\sum_{k=0}^{N-1}\mathrm{e}^{i\frac{2\pi}{\lambda}(x_{k}\sin\theta_{x})}= 1+\mathrm{e}^{i\frac{2\pi}{\lambda}a\sin\theta_x}+ \left(\mathrm{e}^{i\frac{2\pi}{\lambda}a\sin\theta_x}\right)^2+ \ldots+ \left(\mathrm{e}^{i\frac{2\pi}{\lambda}a\sin\theta_x}\right)^{N-1} \] où l'on reconnaît la somme des termes d'une suite géométrique de raison \(r=\mathrm{e}^{i\frac{2\pi}{\lambda}a\sin\theta_x}\). Le terme d'interférence se simplifie : \[ \mathcal{F}_\text{I}= \frac{1-\mathrm{e}^{i\frac{2\pi}{\lambda}Na\sin\theta_x}}{1-\mathrm{e}^{i\frac{2\pi}{\lambda}a\sin\theta_x}}= \frac{\mathrm{e}^{i\frac{\pi\,Na\sin\theta_x}{\lambda}}}{\mathrm{e}^{i\frac{\pi\,a\sin\theta_x}{\lambda}}} \frac{\sin\left(\frac{N\pi a}{\lambda}\sin\theta_x\right)}{\sin\left(\frac{\pi a}{\lambda}\sin\theta_x\right)} \]

Finalement, l'intensité diffractée par le réseau de fentes se met sous la forme \[ I_N(\theta_x)=N^2I_0 \left[\mathrm{sinc}\left(\frac{\pi a_0\sin\theta_{x}}{\lambda}\right)\right]^2 \left[\frac{\sin\left(\frac{N\pi a}{\lambda}\sin\theta_x\right)}{N\sin\left(\frac{\pi a}{\lambda}\sin\theta_x\right)}\right]^{2} \] où l'on retrouve le terme d'interférence décrit dans le chapitre sur les réseaux, modulé par le terme de diffraction lié à la largeur non nulle des fentes. La prise en compte de la diffraction ne modifie pas la position des pics, mais leur intensité. En effet, un pic d'ordre \(p\) vérifiant \(\sin\theta_x=p\frac{\lambda}{a}\) présente une intensité \[ I_\text{pic}=N^2I_0\left[\mathrm{sinc}\left(\frac{p\pi a_0}{a}\right)\right]^2 \]

Distribution angulaire de l'intensité diffractée par un réseau de fentes rectilignes
Distribution angulaire de l'intensité diffractée par un réseau de fentes rectilignes.

Comme on le voit sur la figure ci-dessus, la transmission optique d'un réseau de fentes est maximale pour le pic d'ordre 0.

Remarque

Un des principaux défauts des réseaux ordinaires réside dans la dispersion de l'énergie lumineuse dans les différents pics d'interférence. En général, on préfère utiliser des réseaux dits réseaux blazés, conçus pour que le maximum d'énergie lumineuse se concentre sur un pic dispersif particulier[1]

Pour en savoir plus...

  1. J. Roussel Interférence à N ondes[en ligne], 2018. Disponible sur femto-physique.fr
  2. J. Roussel Interférence à deux ondes[en ligne], 2018. Disponible sur femto-physique.fr
  3. M. Born et al. Principles of optics : electromagnetic theory of propagation, interference and diffraction of lightCambridge University Press, 1999.
  4. W Lauterborn et al. Optique Cohérente. Fondements et applicationsDunod, 1997.
  5. J. Peatross et al. Physics of Light and Optics2015 edition. Disponible sur optics.byu.edu
  6. E. Aristidi Cours d'optique ondulatoire niveau L3 physique - Master 12015. Disponible sur sites.unice.fr
  7. A. Gibaud Diffraction / Diffusion[en ligne], 2010. Disponible sur numeliphy.unisciel.fr
  8. J-M Raymond Électromagnétisme et relativité[en ligne], 2000. Disponible sur ressources.agreg.phys.ens.fr/ressources/