Rappelons qu'une fonction \(f\) est convexe si pour toute paire de points
\(x_1\lt x_2\), et pour tout \(\lambda\in[0,1]\),
\[ f((1-\lambda)x_1+\lambda x_2)\leqslant (1-\lambda) f(x_1)+\lambda f(x_2)\,.\]
L'interprétation géométrique étant la suivante: si on choisit deux points
quelconques sur le graphe de \(f\), le segment qui les relie est
entièrement au-dessus du graphe.
Or on peut remarquer que lorsque \(f\) est dérivable, c'est-à-dire lorsque
\(f'(x)\) est défini pour tout \(x\), alors la convexité semble être équivalente
à la croissance de \(x\mapsto f'(x)\):
Sur l'animation ci-dessus, on a une fonction qui est manifestement convexe et dérivable, et on observe que sa dérivée est croissante. Ceci implique que si la dérivée est dérivable, et si la dérivée de la dérivée, c'est-à-dire la dérivée seconde, est positive, alors la fonction doit être convexe. Plus précisément:
Théorème: Soit \(I\) un intervalle ouvert, \(f:I\to \mathbb{R}\) deux fois dérivable sur \(I\) (\(f\) est dérivable, et \(f'\) est aussi dérivable sur \(I\)).
Il suffit de démontrer la première implication. Remarquons d'abord que comme \(f''\geqslant 0\), \(f'\) est croissante sur \(I\). Soient \(x_1\lt x_2\) dans \(I\). Fixons \(\lambda \in ]0,1[\) et posons \(z:= (1-\lambda)x_1+\lambda x_2\).
On applique deux fois le théorème des accroissements finis:Exemple: Prenons \(f(x)=x^2\) sur \(\mathbb{R}\). Comme \[f''(x)=2\gt 0\qquad \forall x\in \mathbb{R}\,,\] le théorème garantit que \(f\) est convexe.
Exemple: Prenons \(f(x)=e^x\) sur \(\mathbb{R}\). Puisque \[f''(x)=e^x\gt 0\qquad \forall x\in \mathbb{R}\,,\] le théorème garantit que \(f\) est convexe.
Exemple: Considérons maintenant \(f(x)=\log(x)\), sur \(\mathbb{R}_+^*\). Comme \[ f''(x)=-\frac{1}{x^2}\lt 0\qquad \forall x\in \mathbb{R}_+^*\,, \] le théorème entraîne que \(f\) est concave:
Exemple: Considérons le polynôme \(f(x)=x^4-x^2\), et cherchons les intervalles sur lesquels \(f\) est convexe/concave. Puisque \(f\) est deux fois dérivable, l'étude du signe de \(f''(x)=2(6x^2-1)\) donne:
On en déduit par le théorème que: