11.1 Motivation, définition

Nous l'avions dit au début du chapitre sur les vecteurs et valeurs propres, notre but était de un outil permettant d'étudier une application linéaire de façon plus géométrique.

Un idéal: les matrices diagonales

Commençons par décrire les applications qui, même en grande dimensions, sont très simples à comprendre: les applications dont la matrice (relativement à la base canonique) est diagonale. En effet, considérons une application \(T:\mathbb{R}^n\to\mathbb{R}^n\) définie par \[ \boldsymbol{x}= \begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix} \mapsto T(\boldsymbol{x}):= \begin{pmatrix} d_1&0&\cdots&0\\ 0&d_2&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&\cdots&\cdots&d_n \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix} = \begin{pmatrix} d_1x_1\\ d_2x_2\\ \vdots\\ d_nx_n \end{pmatrix} \] Une telle application se comprend simplement dans le sens suivant: chaque variable \(x_k\) n'est que multipliée par \(d_k\), et n'interfère pas avec les autres variables.

Donc une application linéaire dont la matrice dans une base est diagonale correspond dans cette base à faire, indépendamment pour chaque \(k\), une simple ''dilatation'' (''stretching'') par un facteur \(d_k\) selon la composante \(k\).

Exemple: Dans le plan, considérons \[ \boldsymbol{x}= \begin{pmatrix} x_1\\x_2 \end{pmatrix} \mapsto T(\boldsymbol{x})= \begin{pmatrix} 2&0\\ 0&-1 \end{pmatrix} \begin{pmatrix} x_1\\x_2 \end{pmatrix} =\begin{pmatrix} 2x_1\\-x_2 \end{pmatrix}\,. \] Dans ce cas, l'effet de \(T\) simple à décrire: elle multiplie \(x_1\) par \(2\), et change le signe de \(x_2\). Ceci permet de construire l'image d'un \(\boldsymbol{x}\) quelconque à la règle et au compas:

Objectif

On sait que la représentation d'une application linéaire relativement à la base canonique n'est qu'une représentation parmi d'autres. Au vu de la discussion ci-dessus, on peut donc se poser la question de savoir si, pour une application linéaire donnée, il existe une base dans laquelle sa matrice est diagonale. Si c'est le cas (parce que ça ne sera pas toujours possible), alors on a tout avantage à choisir cette base pour travailler, puisque dans cette base l'application ne devient qu'une modification multiplicative de chacune des composantes, indépendamment des autres. Le but de la diagonalisation, que nous présentons dans ce chapitre, est de déterminer si une application donnée peut (ou ne peut pas) être rendue diagonale dans une base bien choisie.

Puisque la diagonalisation a pour but de réduire une application à une base dans laquelle elle ''multiplie simplement les composantes par des nombres'', c'est sans surprise que les notions de vecteur propre et valeur propre joueront un rôle central dans son développement.

Avant de passer à l'étude générale de la diagonalisation, voyons comment elle s'implémente dans un cas simple.

Diagonaliser une application dans le plan

Exemple: Reprenons l'application utilisée comme motivation de la notion de vecteur propre, dans le chapitre précédent: \[ \boldsymbol{x}= \begin{pmatrix} x_1\\ x_2 \end{pmatrix} \mapsto T(\boldsymbol{x}):= \begin{pmatrix} x_2\\ \frac12 x_1-\frac12 x_2 \end{pmatrix} = \begin{pmatrix} x_1\\ x_2 \end{pmatrix} \] Relativement à la base canonique, on a donc \[ [T]_{\mathcal{B}_{\mathrm{can}}}= \begin{pmatrix} 0&1\\ \frac12&-\frac12 \end{pmatrix}\,. \] Nous avions remarqué que certains vecteurs subissaient, sous l'action de \(T\), une simple multiplication par un scalaire. Maintenant que l'on sait que ces vecteurs sont les vecteurs propres, on peut les calculer explicitement. Puisque \[P_{[T]_{\mathcal{B}_{\mathrm{can}}}}(\lambda)=2\lambda^2+\lambda-1\,,\] on a deux valeurs propres:

On peut représenter ces espaces propres, et vérifier comment ils sont modifiés sous l'action de \(T\):
Ensuite, choisissons deux vecteurs propres, \[ \boldsymbol{v}_1= \begin{pmatrix} 2\\1 \end{pmatrix}\in E_{\frac12}\,,\qquad \boldsymbol{v}_2= \begin{pmatrix} -1\\1 \end{pmatrix}\in E_{-1}\,. \] Ces vecteurs étant indépendants (évident, mais surtout vrai parce qu'ils sont associés à des valeurs propres distinctes!), ils forment une base de \(\mathbb{R}^2\): \(\mathcal{B}=(\boldsymbol{v}_1,\boldsymbol{v}_2)\).

Exprimons \(T\) dans cette base \(\mathcal{B}\) formée de vecteurs propres: \[ [T]_{\mathcal{B}}={P_{\mathcal{B}_{\mathrm{can}}\mathcal{B}}}^{-1}[T]_{\mathcal{B}_{\mathrm{can}}} P_{\mathcal{B}_{\mathrm{can}}\mathcal{B}} \] Puisque \[ P_{\mathcal{B}_{\mathrm{can}}\mathcal{B}}= \begin{pmatrix} 2&-1\\ 1&1 \end{pmatrix}\,,\qquad {P_{\mathcal{B}_{\mathrm{can}}\mathcal{B}}}^{-1}= \frac13\begin{pmatrix} 1&1\\ -1&2 \end{pmatrix}\,, \] on a \[\begin{aligned} [T]_{\mathcal{B}} &= \frac13\begin{pmatrix} 1&1\\ -1&2 \end{pmatrix} \begin{pmatrix} 0&1\\ \frac12&-\frac12 \end{pmatrix} \begin{pmatrix} 2&-1\\ 1&1 \end{pmatrix}\\ &= \frac13 \begin{pmatrix} \frac32&0\\ 0&-3 \end{pmatrix}\\ &= \begin{pmatrix} \frac12&0\\ 0&-1 \end{pmatrix}\\ \end{aligned}\] On a ainsi diagonalisé \(T\); sur la diagonale de \([T]_\mathcal{B}\) apparaissent précisément les valeurs propres.

Maintenant, lorsqu'on est dans la base \(\mathcal{B}\), l'effet de \(T\) sur un vecteur devient transparent puisque sa matrice est diagonale. En effet, si \[[\boldsymbol{x}]_{\mathcal{B}}= \begin{pmatrix} x_1\\ x_2 \end{pmatrix}\,,\] alors \[ [T(\boldsymbol{x})]_{\mathcal{B}}=[T]_{\mathcal{B}}[\boldsymbol{x}]_\mathcal{B} =\begin{pmatrix} \frac12&0\\ 0&-1 \end{pmatrix} \begin{pmatrix} x_1\\ x_2 \end{pmatrix} = \begin{pmatrix} \frac12 x_1\\ -x_2 \end{pmatrix} \] Avec cette information, on peut maintenant retourner sur l'animation du dessus, et observer comment effectivement, sous l'action de \(T\), relativement à \(\mathcal{B}\), la première composante de \(\boldsymbol{x}\), est multipliée par \(\frac12\), et la deuxième est multipliée par \(-1\).

Définition générale de la diagonalisabilité
Une matrice \(A\) est diagonalisable si elle est semblable à une matrice diagonale, c'est-à-dire si il existe une matrice diagonale \(D\), et une matrice inversible \(M\) telles que \[A=MDM^{-1}\,.\]

Remarque:

Maintenant se pose la question: comment savoir si une matrice est diagonalisable?

On s'en doute, cette question est reliée à l'existence de valeurs et de vecteurs propres. Mais ça n'est pas suffisant, comme on verra dans la section suivante.