F

MENUCours Outils et Méthodes pour la Physique

La connaissance progresse en intégrant en elle l'incertitude, non en l'exorcisant

Edgar Morin

Accéder à une valeur objective de la réalité sans erreur est tout simplement impossible. L'erreur fait parti de l'opération de mesure. Une des forces de la science est d'avoir mis au point des outils qui permettent d'estimer cette erreur.

Mesurer c'est évaluer

Notion d'erreur et d'incertitude

Expérience

Mesurons, à l'aide d'un chronomètre, la durée $t$ correspondant à 2,5 périodes d'oscillation d'un pendule simple (5 passages à la verticale). En faisant faire cette même mesure par différents élèves on trouve

mesure n°1234
durée $t$3,62 s3,47 s3,44 s3,30 s

L'expérience précédente montre que les résultats sont différents ce qui traduit l'existence d'erreurs de mesure. L'erreur faite lors de la mesure d'une grandeur $x$ est l’écart entre la valeur mesurée ($x_i$) et sa valeur vraie ($x_{\rm vraie}$), laquelle est unique mais inaccessible. Elle présente deux composantes.

L'erreur aléatoire

L'erreur aléatoire $\epsilon_a$ provient des variations temporelles et spatiales non prévisibles de grandeurs d'influence (soin des mesures, température de la pièce, fidélité de l'appareil de mesure, etc.). Elle est définie par \[\epsilon_a=x_i-\overline{x}\] où $\overline{x}$ est la moyenne des mesures obtenue en répétant $N$ fois la même expérience avec $N\to \infty$.

L'erreur systématique

L'erreur systématique $\epsilon_s$ (ou biais) est un décalage constant dont l'origine peut être d'ordre théorique ou expérimentale (influence du mode opératoire, problème de calibrage d'un appareil, modélisation incomplète, etc.). Par définition, \[\epsilon_s=\overline{x}-x_{\rm vraie}\] Ainsi, l'erreur sur une mesure est la somme d'un biais et d'une quantité aléatoire : \[ \epsilon=x_i-x_{\rm vraie}=(x_i-\overline{x})+(\overline{x}-x_{\rm vraie})=\epsilon_a+\epsilon_s \]

Exemple

Dans l'expérience précédente on peut lister les différentes sources d'erreur :

Erreur aléatoireErreur systématique (biais)
réflexe humaindéfaut de parallaxe
fidélité limité du chronomètrechronomètre mal calibrés
erreur de lectureverticale mal positionnée

Bien qu'il ne soit pas possible de compenser l'erreur aléatoire faite sur une mesure, elle peut être réduite en augmentant le nombre d'observations comme nous allons le voir. En revanche, l'erreur systématique d'un résultat de mesure ne peut être réduite en augmentant le nombre d'observations, mais par l'application d'une correction.

Le résultat final est exprimé sous la forme d’un intervalle de valeurs probables \[x=x_{\rm m} \pm \Delta x\] où $x_{\rm m}$ est la mesure, c'est-à-dire la meilleure estimation de la valeur vraie et $\Delta x$ l'incertitude sur la mesure que l'on cherche à évaluer. Plus précisément l'intervalle $[x_{\rm m}-\Delta x,x_{\rm m}+\Delta x]$ est défini comme un intervalle de confiance associé à une probabilité de contenir la valeur vraie $x_{\rm vraie}$. Cette probabilité est appelé niveau de confiance.

Exemple

La masse de l'électron vaut (CODATA 2010) \[ m_{\rm e}=(9,109 382 91\pm 0,000 000 40)\cdot 10^{-31}\;\mathrm{kg} \] avec un niveau de confiance de 68%.

Insistons sur le fait que sans incertitude il nous est impossible de comparer deux résultats ou de réfuter une loi. Pour qu'un résultat ait une valeur scientifique il faut pouvoir prouver que les éventuels écarts entre la théorie et l'expérience sont non significatifs c'est-à-dire liés aux erreurs de mesure ce qui rend nécessaire l'estimation des incertitudes.

Écriture scientifique

Avant de voir comment estimer les incertitudes, faisons une petite mise au point sur les conventions d'écriture scientifique.

Dans une valeur numérique, le premier chiffre non-nul de gauche désigne le chiffre le plus significatif et le dernier chiffre de droite le chiffre le moins significatif. Les nombres 1230, 1,230 et 0,001230 ont ainsi tous quatre chiffres significatifs. Le nombre de chiffres significatifs rend compte de la précision du résultat et permet donc de se faire une idée de l’incertitude, même quand cette dernière n’est pas indiquée. Par exemple, écrire \[c = (3,00278\pm 0,04)\cdot 10^{8}\,\mathrm{m.s^{-1}}\] n'a aucun sens, puisque l'incertitude indique que nous n'avons pas d'information au delà de la deuxième décimale. Il faut donc arrondir le résultat au centième.

Comment arrondir ?

Pour les arrondis on adopte la méthode qui consiste à arrondir au plus près : cela consiste à repérer le dernier chiffre à arrondir (en fonction de la précision) puis à l'augmenter d'une unité si le chiffre suivant est au moins égal à 5 ou à le conserver sinon. Par exemple,

Si l'on reprend l'exemple précédent, on écrira plutôt \[c = (3,00\pm 0,04)\cdot 10^{8}\,\mathrm{m.s^{-1}}\] Par ailleurs, l'incertitude étant elle-même entachée d'une incertitude assez importante, on ne garde qu'un seul chiffre significatif, éventuellement deux si l'on estime faire une erreur d'arrondi trop importante avec un seul chiffre. Par exemple \[ 175,652\pm 6,922\to176\pm7 \quad\text{et}\quad 175,652\pm 1,394\to175,7\pm1,4 \]

En résumé

Une fois l'incertitude estimée, on l'arrondi à un ou deux chiffres. On ajuste la valeur de la mesure $x_{\rm m}$ de manière à ce que son dernier chiffre significatif soit à la même position que celui de l'incertitude en arrondissant au plus près. Le résultat se met sous la forme \[x=(x_{\rm m}\pm\Delta x)\cdot 10^n\quad\text{unité}\]

Comment estimer une incertitude ?

Décrivons les différentes méthodes qui nous permettent d'évaluer les erreurs aléatoires. Notez que l'on suppose les erreurs systématiques négligeables et que ça n'est qu'à la fin, lorsque l'on confronte théorie et expérience, que l'on peut invoquer l'existence de biais pour expliquer un désaccord.

Les différents types d'estimations

Courbe De Gauss
Loi de probabilité d'une variable aléatoire gaussienne. On a 68% de chance de trouver $x$ dans l'intervalle $\overline{x}\pm\sigma$ et 95% dans l'intervalle $\overline{x}\pm2\sigma$.

Finalement, mesurer c'est accéder à une grandeur aléatoire. Cette variable aléatoire présente une distribution qui a souvent l'allure d'une gaussienne dont la figure ci-dessous en donne une représentation.

Pour caractériser la dispersion des résultats autour de la moyenne on définit l'écart-type $\sigma$ : \[ \sigma\equiv\sqrt{\overline{(x-\overline{x})^2}} \] où $\overline{x}$ désigne la moyenneOn dit espérance en mathématique et $\overline{(x-\overline{x})^2}$ la moyenne des écarts quadratiques .On montre qu'il existe une probabilité de 68% pour qu'une mesure soit compris dans l'intervalle $\overline{x}\pm\sigma$. On dit alors que l'intervalle $\overline{x}\pm\sigma$ représente un niveau de confiance de 68%. Le problème que l'on se pose est, comment, à partir de mesures, évaluer les valeurs $\overline{x}$ et $\sigma$ ? Pour cela, il existe deux types d'estimations :

Type A
On répète $n$ fois la même expérience puis on effectue une analyse statistique.
Type B
À partir d'une seule mesure on estime $\overline{x}$ et $\sigma$ à l'aide de différentes informations (notices techniques) et d'hypothèses probabilistes.

Estimation de type A

Supposons que l'on collecte $n$ mesures en répétant $n$ fois la même expérience. On cherche à accéder aux paramètres $\overline{x}$ et $\sigma$ à partir des $n$ mesures $x_1$, $x_2$, ..., $x_n$. Si $n\to \infty$ on pourrait reconstruire la loi de probabilité relative à la variable $x$ et par conséquent calculer $\overline{x}$. Hélas, $n$ est fini ; il faut donc chercher la meilleur façon d'estimer les paramètres $\overline{x}$ et $\sigma$ à partir d'un ensemble discret de mesures.

Nous distinguerons deux situations :

Cas où $n\geq10$

La théorie des probabilités permet de montrer que la meilleur estimation de $\overline{x}$ est la moyenne arithmétique.

Estimation de \(\overline{x}\)

\[m\equiv \dfrac{x_1+x_2+\cdots+x_n}{n}\simeq \overline{x}\]

On montre également que la meilleure estimation de $\sigma$ est l'écart-type non biaisé (noté $\sigma_{n-1}$ sur les calculatrices)

Estimation de \(\sigma\)

\[s\equiv\sqrt{\frac{(x_1-m)^2+(x_2-m)^2+\cdots+(x_n-m)^2}{n-1}}\simeq \sigma\]

Notez que dans cette formule, la somme des écarts quadratiques est divisé par $n-1$ et non par $n$ comme on pourrait s'y attendre. Une façon de retenir ce facteur $n-1$ est de réaliser que pour estimer un écart-type il faut au moins deux mesures ce qui implique $n>1$.

Cas où $n<10$

Si l'échantillon est petit (disons $n≤10$) il y a une correction à apporter. On montre alors que la meilleure estimation de l'écart-type vaut $t\times s$ où $t$ est le coefficient de Student donnée dans le tableau ci-dessous.

Coefficients de Student pour un intervalle de confiance de 68%
Nombres de mesures $n$2345678910
Coefficient $t$1,841,321,201,141,111,091,081,071,06

Exemple

Dans l'expérience précédente, on peut estimer l'incertitude-type associé à la mesure de la durée $t$. On trouve \[m=\dfrac{3,62+3,47+3,44+3,30}{4}=3,4575\;\mathrm{s}\] et puisque l'échantillon contient $n=4$ mesures, \[\sigma_t= 1,2\times\sqrt{\dfrac{(3,62-3,4575)^2+(3,44-3,4575)^2+(3,44-3,4575)^2+(3,30-3,4575)^2}{3}}\simeq0,1575\;\mathrm{s}\] Ainsi, chaque mesure présente une incertitude-type de l'ordre de 0,16 s.

Incertitude sur la moyenne arithmétique

La moyenne arithmétique est la meilleure estimation de la valeur vraie, pour autant elle n'en est pas moins entachée d'une certaine erreur. En effet, si l'on répète une autre série de $n$ mesures on trouve une autre valeur de $m$. Il faut donc chercher à calculer l'écart-type de la moyenne $\sigma_m$. Il est alors assez facile de montrer que \[\sigma_m=\frac{\sigma}{\sqrt{n}}\simeq \frac{t\,s}{\sqrt{n}}\] En d'autres termes, par rapport à une mesure isolée, on réduit l'incertitude d'un facteur $\sqrt{n}$ en procédant à $n$ mesuresOn pourrait croire qu'il suffit de procéder à un très grand nombre de mesures pour accéder à la valeur vraie de façon très précise mais ce serait oublier la présence d'erreurs systématiques qui ne s'effacent pas avec le nombre d'observations. À partir d'un certain nombre n, l'erreur systématique l'emporte sur l'erreur aléatoire. Toute la difficulté réside alors dans la détermination puis la correction des différents biais, comme nous le rappelle la très médiatique affaire des neutrinos supraluminiques.. Finalement, le résultat se met sous la forme

Mesure de type A

\begin{equation} x=m\pm\frac{t\,s}{\sqrt{n}}\quad\text{unité} \quad\text{avec}\quad \left\{ \begin{array}{rcl} m &\equiv& \displaystyle{\frac{1}{n}\sum x_i}\\[3mm] s &\equiv& \displaystyle{\sqrt{\dfrac{1}{n-1}\sum (x_i-m)^2}} \end{array} \right. \end{equation}

Exemple

Dans l'expérience qui nous sert de fil rouge, on peut accéder à une valeur précise de $t$ en calculant sa moyenne arithmétique $m$ et son incertitude-type : \[ m=3,4575 \qquad\text{et}\qquad \sigma_m=\frac{0,1575}{\sqrt 4}=0,0787 \] Après avoir arrondi à un chiffre l'incertitude-type on peut finalement écrire le résultats de nos observations : \[ t=3,46\pm 0,08 \;\mathrm{s}\qquad \text{niveau de confiance : 68%}\]

Estimation de type B

Lorsque l'on procède à une unique mesure on ne peut plus estimer l'incertitude-type de façon statistique. On procède alors de la manière suivante.

  1. On détermine la plage d'erreur $\Delta=x_{\rm max}-x_{\rm min}$ dans laquelle il est raisonnable de penser que se trouve la valeur vraie. Cette plage d'erreur peut être fournie par la notice technique d'un appareil de mesure, ou déterminée de façon empirique en fonction des conditions de l'expérience. Il ne faut pas oublier qu'une estimation à un chiffre significatif suffit.
  2. On fait ensuite l'hypothèse que la probabilité de trouver la valeur vraie dans cet intervalle est uniforme. Il est alors facile de montrer grâce aux probabilités que \begin{equation} \overline{x}\simeq\frac{x_{\rm max}+x_{\rm min}}{2} \qquad\text{et}\qquad \sigma\simeq\frac{\Delta}{\sqrt{12}} \end{equation}

Exemples

  1. On souhaite déterminer par autocollimation la focale d’une lentille convergente. La plage de distance qui permet d’obtenir l’image nette de l’objet par le miroir est 9,8 cm -- 11,2 cm. Comme valeur vraie, on prendra le centre de la plage : \[f'= \dfrac{11,2+9,8}{2} = 10,5\,\mathrm{cm}\] Pour calculer l’incertitude, on effectue \[\sigma_{f'} =\dfrac{11,2-9,8}{\sqrt{12}} = 0,4\;\mathrm{cm}\]
  2. On mesure une tension de 4,32 V avec un voltmètre sur le calibre 20 V, la résolution est de 10 mV. La notice technique indique une précision de ±(0,5% valeur lue + 1 digit). La plage d'erreur vaut donc \[\Delta=2\times[(0,5\times 4,32)/100+0,01]=0,0632\;\mathrm{V}\] et l’incertitude-type \[\sigma = \dfrac{0,0632}{\sqrt{12}} \simeq 0,02\;\mathrm{V}\]

Incertitude composée

La plupart du temps, l'erreur expérimentale présente de nombreuses composantes dont on peut estimer l'incertitude-type (notée $\sigma_i$). Pour obtenir l'incertitude globale il faut alors composer les incertitudes-type. Si l'on suppose ces différentes composantes indépendantes, alors en vertu de la loi de composition des variances, on a : \[ \sigma_{\rm total}=\sqrt{\sum_i\sigma_i^2}\]

On notera que puisque l'on arrondit l'incertitude à un chiffre significatif, il est possible de négliger $\sigma_i$ si ce dernier est au moins trois fois plus petit que le terme le plus important.

Exemple

Reprenons notre expérience. On a estimé l'incertitude-type associée notamment au réflexe humain par la méthode de type A et on a trouvé $\sigma_A=0,0787\;\mathrm{s}$. En revanche, le chronomètre présente une erreur de justesse qui n'est pas évaluée par la méthode de type A. Si l'on suppose une précision du chronomètre égale au 1/100ième s, on prendra \[ \sigma_B=\frac{0,01}{\sqrt{12}}=3\;\mathrm{ms}\] On constate que l'erreur liée au manipulateur est prépondérante et qu'il est légitime de négliger l'erreur liée à l'instrument : $\sigma_{\rm total}=\sigma_A$.

Incertitude élargie

Pour finir, il est d'usage de donner les incertitudes avec un niveau de confiance de 95%. On notera $\Delta x$ cette incertitude dite élargie :

\begin{equation} \Delta x=k\sigma \quad\text{avec}\quad k=2\quad\text{pour un niveau de confiance de 95%} \end{equation}

Si rien n'est précisé, le résultat d'une mesure est a donner avec un niveau de confiance de 95%, ce qui correspond à un bon niveau de confiance.

On définit aussi l'incertitude relative par \[\frac{\Delta x}{x}\quad\text{exprimé en %}\] Plus elle est petite, plus la mesure est précise.

Expérience

Finalement, la durée correspondant à 2,5 périodes d'oscillations du pendule simple peut s'écrire \[ t=3,46\pm 0,16 \;\mathrm{s}\qquad \text{niveau de confiance : 95%}\] ce qui signifie que la période des oscillations vaut \[T=1,38\pm 0,06\;\mathrm{s}\qquad \text{niveau de confiance : 95%}\] L'incertitude est donc de 4% en valeur relative.

Propagation des erreurs

Supposons que l'on mesure $n$ grandeurs différentes $x_1,x_2,\ldots,x_n$ et que l'on calcule, à partir d'une loi physique ou d'une définition, une nouvelle grandeur $G=f(x_1,x_2,\ldots,x_n)$. Connaissant les incertitudes $\Delta x_{i=1\ldots n}$ associées aux $n$ mesures, il est alors légitime de se demander quelle est l'incertitude de $G$ suite à la propagation des erreurs dans le calcul de $G$.

Cas d'une loi affine

Propagation Affine
Propagation des incertitudes dans le cas d'une relation affine.

Commençons par un cas simple, celui d'une relation affine à une seule variable : \[ G=ax+b \quad\text{avec}\quad x=x_m\pm\Delta x\]

Dans ce cas, il est facile de voir sur un graphique qu'une incertitude $\Delta x$ produit une incertitude $\Delta G=|a|\Delta x$ de sorte que le calcul donne

\begin{equation} G=G_m\pm\Delta G \quad\text{avec}\quad \left\{\begin{array}{rcl} G_m &=&ax_{\rm m}+b\\ \Delta G&=&|a|\Delta x \end{array}\right. \end{equation}

Exercice

L'indice de réfraction de l'air à 20°C varie avec la pression selon la loi de Gladstone : $n=1+kP$ avec $k=(27\pm 1).10^{-5}\;\mathrm{bar^{-1}}$ et où $P$ est exprimé en bar. Que vaut l'indice de l'air à 20°C et à la pression $P=2$ bar ?

Le calcul de $n$ et de son incertitude donne \[n=1+27.10^{-5}\times 2=1,00054 \quad\text{et}\quad \Delta n=P\Delta k=2.10^{-5}\] On écrira donc \[n=1,00054\pm0,00002\]

Cas d'une loi puissance

Supposons maintenant que la grandeur $G$ dépend d'une variable $x$ via une loi de puissance : \[ G=G_0\,x^n \] et cherchons à estimer l'incertitude de $G$ liée à la propagation de l'incertitude de $x$. Pour cela nous allons supposer que les incertitudes sont petites en valeur relative. Cela signifie qu'entre $x$ et $x+\Delta x$, $G$ varie si peu qu'on peut approcher la courbe par un segment de coefficient directeur \[ a=\frac{\mathrm{d}G}{\mathrm{d}x}=n\,G_0\, x^{n-1} \] Si l'on applique le résultat du paragraphe précédent, on trouve donc $\Delta G=|a|\,\Delta x=|n\,G_0\,x^{n-1}|\,\Delta x$. En divisant par $G_{\rm m}$ on trouve la règle simple suivante.

Dans le cas d'une loi de puissance, l'incertitude relative est multipliée par la puissance : \begin{equation} \left|\frac{\Delta G}{G_{\rm m}}\right|=\left|n\frac{\Delta x}{x}\right| \end{equation}

Exemple

On cherche à déterminer le volume d'une bille d'acier de rayon $r=(2,778\pm 0,005)\;\mathrm{mm}$. Sachant que le volume d'une sphère s'écrit $V=4/3\pi\,r^3$ on trouve \[V_{\rm m}=89,80\;\mathrm{mm^3}\quad\text{et}\quad \frac{\Delta V}{V}=3\frac{\Delta r}{r}=0,54\%\quad\Longrightarrow\quad\Delta V=0,5\;\mathrm{mm^3}\] On écrira donc $V=(89,8\pm0,5)\;\mathrm{mm^3}$

Méthode générale

$G$ ne dépend que d'une variable

En physique, il arrive souvent que le calcul d'une grandeur $G$ implique plusieurs variables. Cependant, il également assez courant qu'une des variables soit moins précise que les autres de sorte que l'on peut considérer les autres variables comme des paramètres constants. On peut alors considérer que \[G=f(x) \quad\text{avec}\quad x=x_m\pm\Delta x\] Dans ce cas, et à condition de $G$ varie peu entre $x_m$ et $x_m \pm\Delta x$, on retiendra la méthode suivante.

\begin{equation} G=G_m\pm\Delta G \quad\text{avec}\quad \left\{\begin{array}{rcl} G_m &=&f(x_m)\\ \Delta G&=&\left|f'(x_m)\right|\Delta x \end{array}\right. \end{equation}

$G$ dépend de $n$ variables

Considérons maintenant le cas général \[G=f(x_1,x_2,\ldots,x_n) \quad\text{avec}\quad x_i=x_{\text{m,}i}\pm \Delta x_i\] Si les grandeurs $x_i$ sont indépendantes, on utilise la méthode suivante.

Méthode générale

  1. Différentier la relation $G=f(x_1,x_2,\ldots,x_n)$ de façon à écrire \[\mathrm{d}G=a_1\, \mathrm{d}x_1+\ldots+a_n\,\mathrm{d}x_n \quad\text{avec}\quad a_1=\frac{\partial f}{\partial x_1}\text{, etc.}\]
  2. L'incertitude de la mesure vaut \[\Delta G=\sqrt{(a_1\Delta x_1)^2 + (a_2\Delta x_2)^2+\ldots+(a_n\Delta x_n)^2}\]

Exemple

Un dipôle électrique est soumis à la tension $U=(2,6\pm0,3)\;\mathrm{V}$ ce qui produit un courant d'intensité $I=(0,89\pm0,06)\;\mathrm{A}$. Calculons la puissance électrique $P=U.I$ fournie à ce dipôle.

Tout d'abord, la valeur numérique de la puissance vaut \[P_{\rm m}=U_{\rm m}I_{\rm m}=2,6\times0,89=2,314\;\mathrm{W}\] Ensuite, calculons les dérivées par rapport à $U$ et $I$ : \[\dfrac{\partial P}{\partial U}=I \quad\text{et}\quad \dfrac{\partial P}{\partial I}=U \quad\Longrightarrow\quad \mathrm{d}P=I\, \mathrm{d}U+U\,\mathrm{d}I \] On en déduit l'incertitude sur le calcul de $G$ : \[\Delta P=\sqrt{(0,89\times 0,3)^2+(2,6\times 0,06)^2}=0,31\;\mathrm{W}\] On écrira donc : \[P=2,3\pm0,3\;\mathrm{W}\]

Cas où les données sont fournies sans incertitudes

Il arrive fréquemment, notamment dans les sujets de concours, que l'on ait à faire un calcul à partir de données dont les incertitudes sont absentes. Dans ce cas c'est le nombre de chiffres significatifs qui indique la précision. On admet alors que le dernier chiffre significatif est connu à ±0,5. Par exemple, \[v=55\;\mathrm{km.h^{-1}}\quad\text{signifie}\quad v=55,0\pm0,5\;\mathrm{km.h^{-1}}\] Donc, rigoureusement, pour savoir comment arrondir le résultat d'un calcul il faudrait faire une estimation de l'incertitude liée au calcul. Cependant, pour éviter de perdre du temps, on pourra appliquer la méthode suivante.

Lors d'un calcul, la grandeur la moins précise impose son nombre de chiffres significatifs au résultat.

Par exemple, considérons le calcul \[L=\frac{0,300\times4,180\times(15-7,0)}{0,069}=145,3913043 \] Parmi les grandeurs utilisées dans ce calcul, les moins précises comportent deux chiffres significatifs ; le résultat sera alors exprimé avec deux chiffres significatifs, soit \[L = 1,5\cdot 10^{2}\]

Bien que très pratique, cette règle est à utiliser avec précaution notamment lorsque le calcul fait intervenir la différence de deux termes proches.

Exemple

Dans un circuit électrique, on mesure deux tensions $U_1=3,45$ V et $U_2=3,48$ V afin de calculer la grandeur $U=U_2-U_1$.

Vous aimez ?

Pour en savoir plus...

  1. J. Taylor. Incertitudes et analyse des erreurs dans les mesures physiques, Paris, Dunod, 2000.
  2. F-X. Bally, J-M. Berroir. Incertitudes expérimentales. ENS, Université Paris, Paris, 2010.
  3. D. Larousserie Neutrinos supraluminiques : chercher l'erreur Le Monde [en ligne, consulté le 2015-06-06] http://www.lemonde.fr/sciences/article/2012/09/27/supraluminique-chercher-l-erreur_1766930_1650684.html