6.6 Convexité/concavité

La convexité est une propriété géométrique associée au graphe d'une fonction. Commençons par en donner une définition un peu informelle.

On dit qu'une fonction est convexe si tous les points situés sur le segment reliant deux points quelconques de son graphe sont au-dessus du graphe,

AA
BB

et on dit qu'elle est concave si tous les points situés sur le segment reliant deux points quelconques de son graphe sont au-dessous du graphe:

AA
BB

Remarque: ff est concave si et seulement si f-f est convexe.

Pour définir analytiquement (plutôt que géométriquement) la convexité, il faut que nous décrivions précisément le segment reliant deux points du graphe.

Soit donc ff une fonction donnée, et soient x1<x2x_1\lt x_2 deux réels. On peut paramétrer toutes les positions intermédiaires (sur l'axe réel) entre x1x_1 et x2x_2 à l'aide d'un paramètre λ[0,1]\lambda\in [0,1], en définissant x(λ):=x1+λ(x2x1)=(1λ)x1+λx2. x(\lambda):= x_1+\lambda(x_2-x_1) =(1-\lambda)x_1+\lambda x_2\,. On a x(0)=x1x(0)=x_1, x(1)=x2x(1)=x_2, et toute autre valeur 0<λ<10\lt \lambda\lt 1 représente un point intermédiaire: x1<x(λ)<x2x_1\lt x(\lambda)\lt x_2.

Maintenant, le point sur le segment reliant A=(x1,f(x1))A=(x_1,f(x_1)) à B=(x2,f(x2))B=(x_2,f(x_2)), situé au-dessus de x(λ)x(\lambda), est à hauteur y(λ)=f(x1)+λ(f(x2)f(x1))=(1λ)f(x1)+λf(x2).y(\lambda)= f(x_1)+\lambda(f(x_2)-f(x_1)) =(1-\lambda)f(x_1)+\lambda f(x_2)\,.

x1x_1
x2x_2
f(x1)f(x_1)
f(x2)f(x_2)
λ=0.40\lambda=0.40\dots
x(λ)x(\lambda)
f(x(λ))f(x(\lambda))
y(λ)y(\lambda)

Le segment est donc entièrement au-dessus du graphe si et seulement si f(x(λ))y(λ)λ[0,1], f(x(\lambda)) \leqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, et il est entièrement au-dessous du graphe si et seulement si f(x(λ))y(λ)λ[0,1], f(x(\lambda)) \geqslant y(\lambda) \qquad \forall\lambda\in[0,1]\,, Ceci mène à la définition analytique de convexité/concavité:

Soit II un intervalle, borné ou pas, et f:IRf:I\to \mathbb{R}.

Exemple: f(x)=xf(x)=|x| est convexe. En effet, fixons deux points quelconques x1<x2x_1\lt x_2. Alors pour tout λ[0,1]\lambda\in[0,1], par l'inégalité triangulaire, f((1λ)x1+λx2)=(1λ)x1+λx2(1λ)x1+λx2=(1λ)x1+λx2=(1λ)f(x1)+λf(x2).\begin{aligned} f\bigl((1-\lambda)x_1+\lambda x_2\bigr) &=\bigl|(1-\lambda)x_1+\lambda x_2\bigr|\\ &\leqslant \bigl|(1-\lambda)x_1\bigr|+\bigl|\lambda x_2\bigr|\\ &=(1-\lambda)|x_1|+\lambda |x_2|\\ &=(1-\lambda)f(x_1)+\lambda f(x_2)\,. \end{aligned}

Exemple: f(x)=x2f(x)=x^2 est convexe (sur tout R\mathbb{R}). En effet, f((1λ)x1+λx2)(1λ)f(x1)λf(x2)=((1λ)x1+λx2)2(1λ)x12λx22=λ(1λ)0(x1x2)20.\begin{aligned} f((1-\lambda)x_1+\lambda x_2) &-(1-\lambda) f(x_1)-\lambda f(x_2)\\ &=\bigl((1-\lambda)x_1+\lambda x_2\bigr)^2-(1-\lambda)x_1^2-\lambda x_2^2\\ &=-\underbrace{\lambda(1-\lambda)}_{\geqslant 0}(x_1-x_2)^2\\ &\leqslant 0\,. \end{aligned}

La définition de convexité donnée ci-dessus traduit la propriété géométrique énoncée en début de section, mais elle peut être difficile à mettre en oeuvre, même dans des cas très simples.

Exemple: La connaissance du graphe de la fonction exponentielle f(x)=exf(x)=e^x indique qu'elle est probablement convexe:

Mais montrer ''à la main'' que e(1λ)x1+λx2(1λ)ex1+λex2x1<x2,λ[0,1] e^{(1-\lambda)x_1+\lambda x_2}\leqslant (1-\lambda)e^{x_1}+\lambda e^{x_2}\qquad \forall x_1\lt x_2\,,\forall \lambda\in [0,1] n'est pas simple.

Il serait donc utile d'avoir un moyen plus direct d'obtenir la convexité. Nous y reviendrons après avoir les outils fournis par le calcul différentiel.

Quiz 6.6-1 : Soit f:[a,b]Rf:[a,b]\to \mathbb{R}. Vrai ou faux?
  1. ff est soit convexe, soit concave.
  2. Si f((1t)a+tb)(1t)f(a)+tf(b)f((1-t)a+tb)\leqslant (1-t)f(a)+tf(b) pour tout t[0,1]t\in [0,1], alors ff est convexe.
  3. Si ff n'est pas convexe, elle est concave.
  4. Si ff est convexe, f-f est concave.
  5. Si ff est convexe, et si g:[a,b]Rg:[a,b]\to \mathbb{R} est aussi convexe, alors f+gf+g est convexe.
  6. Si il existe x1,x2[a,b]x_1,x_2\in [a,b] et t[0,1]t\in [0,1] tels que f(tx1+(1t)x2)>tf(x1)+(1t)f(x2),f(tx_1+(1-t)x_2)\gt tf(x_1)+(1-t)f(x_2)\,, alors ff est concave.
  7. Si il existe x1,x2[a,b]x_1,x_2\in [a,b] et t[0,1]t\in [0,1] tels que f(tx1+(1t)x2)>tf(x1)+(1t)f(x2),f(tx_1+(1-t)x_2)\gt tf(x_1)+(1-t)f(x_2)\,, alors ff n'est pas convexe.
  8. Si ff est convexe, alors pour tout aa<bba\leqslant a'\lt b'\leqslant b, f:[a,b]Rf:[a',b']\to \mathbb{R} est aussi convexe.
  9. Si ff est à la fois convexe et concave, alors c'est une constante.