La convexité est une propriété géométrique
associée au graphe d'une fonction. Commençons par en donner une définition un
peu informelle.
On dit qu'une fonction est
convexe si tous les points situés sur le
segment reliant deux
points quelconques de son graphe sont au-dessus du graphe,
et on dit qu'elle est concave si tous les points situés sur le segment reliant deux points quelconques de son graphe sont au-dessous du graphe:
Remarque: \(f\) est concave si et seulement si \(-f\) est convexe.
Pour définir analytiquement (plutôt que géométriquement) la convexité, il faut que nous décrivions précisément le segment reliant deux points du graphe.
Soit donc \(f\) une fonction donnée, et
soient \(x_1\lt x_2\) deux réels. On peut paramétrer toutes les positions
intermédiaires (sur l'axe réel)
entre \(x_1\) et \(x_2\) à l'aide d'un paramètre \(\lambda\in
[0,1]\), en définissant
\[
x(\lambda):=
x_1+\lambda(x_2-x_1)
=(1-\lambda)x_1+\lambda x_2\,.
\]
On a \(x(0)=x_1\), \(x(1)=x_2\), et toute autre valeur
\(0\lt \lambda\lt 1\) représente un point intermédiaire: \(x_1\lt x(\lambda)\lt
x_2\).
Maintenant, le point sur le segment reliant \(A=(x_1,f(x_1))\) à
\(B=(x_2,f(x_2))\), situé au-dessus de
\(x(\lambda)\), est à hauteur
\[y(\lambda)=
f(x_1)+\lambda(f(x_2)-f(x_1))
=(1-\lambda)f(x_1)+\lambda f(x_2)\,.
\]
Le segment est donc entièrement au-dessus du graphe si et seulement si \[ f(x(\lambda)) \leqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, \] et il est entièrement au-dessous du graphe si et seulement si \[ f(x(\lambda)) \geqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, \] Ceci mène à la définition analytique de convexité/concavité:
Exemple: \(f(x)=|x|\) est convexe. En effet, fixons deux points quelconques \(x_1\lt x_2\). Alors pour tout \(\lambda\in[0,1]\), par l'inégalité triangulaire, \[\begin{aligned} f\bigl((1-\lambda)x_1+\lambda x_2\bigr) &=\bigl|(1-\lambda)x_1+\lambda x_2\bigr|\\ &\leqslant \bigl|(1-\lambda)x_1\bigr|+\bigl|\lambda x_2\bigr|\\ &=(1-\lambda)|x_1|+\lambda |x_2|\\ &=(1-\lambda)f(x_1)+\lambda f(x_2)\,. \end{aligned}\]
Exemple: \(f(x)=x^2\) est convexe (sur tout \(\mathbb{R}\)). En effet, \[\begin{aligned} f((1-\lambda)x_1+\lambda x_2) &-(1-\lambda) f(x_1)-\lambda f(x_2)\\ &=\bigl((1-\lambda)x_1+\lambda x_2\bigr)^2-(1-\lambda)x_1^2-\lambda x_2^2\\ &=-\underbrace{\lambda(1-\lambda)}_{\geqslant 0}(x_1-x_2)^2\\ &\leqslant 0\,. \end{aligned}\]
La définition de convexité donnée ci-dessus traduit la propriété géométrique énoncée en début de section, mais elle peut être difficile à mettre en oeuvre, même dans des cas très simples.
Exemple: La connaissance du graphe de la fonction exponentielle \(f(x)=e^x\) indique qu'elle est probablement convexe:
Mais montrer ''à la main'' que \[ e^{(1-\lambda)x_1+\lambda x_2}\leqslant (1-\lambda)e^{x_1}+\lambda e^{x_2}\qquad \forall x_1\lt x_2\,,\forall \lambda\in [0,1] \] n'est pas simple.Il serait donc utile d'avoir un moyen plus direct d'obtenir la convexité. Nous y reviendrons après avoir les outils fournis par le calcul différentiel.