La convexité est une propriété géométrique
associée au graphe d'une fonction. Commençons par en donner une définition un
peu informelle.
On dit qu'une fonction est
convexe si tous les points situés sur le
segment reliant deux
points quelconques de son graphe sont au-dessus du graphe,
0,0
A
B
et on dit qu'elle est
concave si tous les points situés sur le segment reliant deux
points quelconques de son graphe sont au-dessous du graphe:
0,0
A
B
Remarque:f est concave si et seulement si −f est convexe.
Pour définir analytiquement (plutôt que géométriquement) la
convexité, il faut que nous décrivions
précisément le segment reliant deux points du graphe.
Soit donc f une fonction donnée, et
soient x1<x2 deux réels. On peut paramétrer toutes les positions
intermédiaires (sur l'axe réel)
entre x1 et x2 à l'aide d'un paramètre λ∈[0,1], en définissant
x(λ):=x1+λ(x2−x1)=(1−λ)x1+λx2.
On a x(0)=x1, x(1)=x2, et toute autre valeur
0<λ<1 représente un point intermédiaire: x1<x(λ)<x2.
Maintenant, le point sur le segment reliant A=(x1,f(x1)) à
B=(x2,f(x2)), situé au-dessus de
x(λ), est à hauteur
y(λ)=f(x1)+λ(f(x2)−f(x1))=(1−λ)f(x1)+λf(x2).
0,0
x1
x2
f(x1)
f(x2)
λ=0.40…
x(λ)
f(x(λ))
y(λ)
Le segment est donc entièrement
au-dessus du graphe si et seulement si
f(x(λ))⩽y(λ)∀λ∈[0,1],
et il est entièrement
au-dessous du graphe si et seulement si
f(x(λ))⩾y(λ)∀λ∈[0,1],
Ceci mène à la définition analytique de convexité/concavité:
Soit I un intervalle, borné ou pas, et f:I→R.
f est convexe si pour toute paire x1,x2∈I,
f((1−λ)x1+λx2)⩽(1−λ)f(x1)+λf(x2).
f est concave si −f est convexe, c'est-à-dire si
pour toute paire x1,x2∈I,
f((1−λ)x1+λx2)⩾(1−λ)f(x1)+λf(x2).
Exemple:f(x)=∣x∣ est convexe. En effet, fixons deux points quelconques x1<x2. Alors pour tout λ∈[0,1],
par l'inégalité triangulaire,
f((1−λ)x1+λx2)=(1−λ)x1+λx2⩽(1−λ)x1+λx2=(1−λ)∣x1∣+λ∣x2∣=(1−λ)f(x1)+λf(x2).
Exemple:f(x)=x2 est convexe (sur tout R). En effet,
f((1−λ)x1+λx2)−(1−λ)f(x1)−λf(x2)=((1−λ)x1+λx2)2−(1−λ)x12−λx22=−⩾0λ(1−λ)(x1−x2)2⩽0.
La définition de convexité donnée ci-dessus traduit la propriété
géométrique énoncée en début de section, mais elle peut être difficile à mettre
en oeuvre, même dans des cas très simples.
Exemple:
La connaissance du graphe de la
fonction exponentielle f(x)=ex indique qu'elle est probablement convexe:
Mais montrer ''à la main'' que
e(1−λ)x1+λx2⩽(1−λ)ex1+λex2∀x1<x2,∀λ∈[0,1]
n'est pas simple.
Il serait donc utile d'avoir un moyen plus direct d'obtenir la convexité.
Nous y reviendrons après avoir les outils fournis par le calcul différentiel.
Quiz 6.6-1 :
Soit f:[a,b]→R. Vrai ou faux?
f est soit convexe, soit concave.
Si
f((1−t)a+tb)⩽(1−t)f(a)+tf(b) pour tout t∈[0,1], alors
f est convexe.
Si f n'est pas convexe, elle est concave.
Si f est convexe, −f est concave.
Si f est convexe, et si
g:[a,b]→R est aussi convexe, alors f+g est convexe.
Si il existe x1,x2∈[a,b] et t∈[0,1] tels que
f(tx1+(1−t)x2)>tf(x1)+(1−t)f(x2),
alors f est concave.
Si il existe x1,x2∈[a,b] et t∈[0,1] tels que
f(tx1+(1−t)x2)>tf(x1)+(1−t)f(x2),
alors f n'est pas convexe.
Si f est convexe, alors pour tout a⩽a′<b′⩽b,
f:[a′,b′]→R est aussi convexe.
Si f est à la fois convexe et concave, alors c'est une constante.