6.6 Convexité/concavité

La convexité est une propriété géométrique associée au graphe d'une fonction. Commençons par en donner une définition un peu informelle.

On dit qu'une fonction est convexe si tous les points situés sur le segment reliant deux points quelconques de son graphe sont au-dessus du graphe,

et on dit qu'elle est concave si tous les points situés sur le segment reliant deux points quelconques de son graphe sont au-dessous du graphe:

Remarque: \(f\) est concave si et seulement si \(-f\) est convexe.

Pour définir analytiquement (plutôt que géométriquement) la convexité, il faut que nous décrivions précisément le segment reliant deux points du graphe.

Soit donc \(f\) une fonction donnée, et soient \(x_1\lt x_2\) deux réels. On peut paramétrer toutes les positions intermédiaires (sur l'axe réel) entre \(x_1\) et \(x_2\) à l'aide d'un paramètre \(\lambda\in [0,1]\), en définissant \[ x(\lambda):= x_1+\lambda(x_2-x_1) =(1-\lambda)x_1+\lambda x_2\,. \] On a \(x(0)=x_1\), \(x(1)=x_2\), et toute autre valeur \(0\lt \lambda\lt 1\) représente un point intermédiaire: \(x_1\lt x(\lambda)\lt x_2\).

Maintenant, le point sur le segment reliant \(A=(x_1,f(x_1))\) à \(B=(x_2,f(x_2))\), situé au-dessus de \(x(\lambda)\), est à hauteur \[y(\lambda)= f(x_1)+\lambda(f(x_2)-f(x_1)) =(1-\lambda)f(x_1)+\lambda f(x_2)\,. \]

Le segment est donc entièrement au-dessus du graphe si et seulement si \[ f(x(\lambda)) \leqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, \] et il est entièrement au-dessous du graphe si et seulement si \[ f(x(\lambda)) \geqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, \] Ceci mène à la définition analytique de convexité/concavité:

Soit \(I\) un intervalle, borné ou pas, et \(f:I\to \mathbb{R}\).

Exemple: \(f(x)=|x|\) est convexe. En effet, fixons deux points quelconques \(x_1\lt x_2\). Alors pour tout \(\lambda\in[0,1]\), par l'inégalité triangulaire, \[\begin{aligned} f\bigl((1-\lambda)x_1+\lambda x_2\bigr) &=\bigl|(1-\lambda)x_1+\lambda x_2\bigr|\\ &\leqslant \bigl|(1-\lambda)x_1\bigr|+\bigl|\lambda x_2\bigr|\\ &=(1-\lambda)|x_1|+\lambda |x_2|\\ &=(1-\lambda)f(x_1)+\lambda f(x_2)\,. \end{aligned}\]

Exemple: \(f(x)=x^2\) est convexe (sur tout \(\mathbb{R}\)). En effet, \[\begin{aligned} f((1-\lambda)x_1+\lambda x_2) &-(1-\lambda) f(x_1)-\lambda f(x_2)\\ &=\bigl((1-\lambda)x_1+\lambda x_2\bigr)^2-(1-\lambda)x_1^2-\lambda x_2^2\\ &=-\underbrace{\lambda(1-\lambda)}_{\geqslant 0}(x_1-x_2)^2\\ &\leqslant 0\,. \end{aligned}\]

La définition de convexité donnée ci-dessus traduit la propriété géométrique énoncée en début de section, mais elle peut être difficile à mettre en oeuvre, même dans des cas très simples.

Exemple: La connaissance du graphe de la fonction exponentielle \(f(x)=e^x\) indique qu'elle est probablement convexe:

Mais montrer ''à la main'' que \[ e^{(1-\lambda)x_1+\lambda x_2}\leqslant (1-\lambda)e^{x_1}+\lambda e^{x_2}\qquad \forall x_1\lt x_2\,,\forall \lambda\in [0,1] \] n'est pas simple.

Il serait donc utile d'avoir un moyen plus direct d'obtenir la convexité. Nous y reviendrons après avoir les outils fournis par le calcul différentiel.

Quiz 6.6-1 : Soit \(f:[a,b]\to \mathbb{R}\). Vrai ou faux?
  1. \(f\) est soit convexe, soit concave.
  2. Si \[f((1-t)a+tb)\leqslant (1-t)f(a)+tf(b)\] pour tout \(t\in [0,1]\), alors \(f\) est convexe.
  3. Si \(f\) n'est pas convexe, elle est concave.
  4. Si \(f\) est convexe, \(-f\) est concave.
  5. Si \(f\) est convexe, et si \(g:[a,b]\to \mathbb{R}\) est aussi convexe, alors \(f+g\) est convexe.
  6. Si il existe \(x_1,x_2\in [a,b]\) et \(t\in [0,1]\) tels que \[f(tx_1+(1-t)x_2)\gt tf(x_1)+(1-t)f(x_2)\,,\] alors \(f\) est concave.
  7. Si il existe \(x_1,x_2\in [a,b]\) et \(t\in [0,1]\) tels que \[f(tx_1+(1-t)x_2)\gt tf(x_1)+(1-t)f(x_2)\,,\] alors \(f\) n'est pas convexe.
  8. Si \(f\) est convexe, alors pour tout \(a\leqslant a'\lt b'\leqslant b\), \(f:[a',b']\to \mathbb{R}\) est aussi convexe.
  9. Si \(f\) est à la fois convexe et concave, alors c'est une constante.