Algèbre linéaire | S. Friedli, S. Herscovich (EPFL)

Commençons par introduire la généralisation abstraite de la notion de vecteur rencontrée dans les chapitres précédents:

Un espace vectoriel est un ensemble non-vide, noté souvent \(V\), dont les éléments sont appelés vecteurs, notés souvent \(u,v,w,\dots\) , muni d'une addition et d'une multiplication par un scalaire, satisfaisant aux propriétés suivantes:

(EV.1) \(u+v=v+u\) pour tous \(u,v\in V\) (commutativité);
(EV.2) \(u+(v+w)=(u+v)+w\) pour tous \(u,v,w\in V\) (associativité);
(EV.3) il existe un élément \(\mathbf{0}_{V}\in V\), appelé vecteur nul et souvent écrit simplement \(\mathbf{0}\), tel que pour tout \(v\in V\), \[v+\mathbf{0}_{V}=\mathbf{0}_{V}+v=v\]
(EV.4) pour tout \(v\in V\), il existe un vecteur \(-v\), appelé vecteur opposé de \(v\), tel que \[v+(-v)=(-v)+v=\mathbf{0}_{V}\,;\]
(EV.5) \(\lambda(u+v)=\lambda u+\lambda v\) pour tous \(\lambda\in \mathbb{R}\), \(u,v\in V\) (distributivité I);
(EV.6) \((\lambda+\mu)v=\lambda v+\mu v\) pour tous \(\lambda,\mu\in \mathbb{R}\), \(v\in V\) (distributivité II);
(EV.7) \(\lambda(\mu v)=(\lambda \mu)v=\mu(\lambda v)\) pour tous \(\lambda,\mu\in \mathbb{R}\), \(v\in V\) (associativité mixte);
(EV.8) \(1v=v\) pour tout \(v\in V\).

Donc un espace vectoriel est simplement un ensemble d'objets abstraits appelés vecteurs, dans lequel un ''\(+\)'' permet d'additionner ces vecteurs, et dans lequel on peut multiplier les vecteurs par des scalaires.

Espaces \(\mathbb{R}^n\)

Le premier exemple d'espace vectoriel que nous avons rencontré est bien-sûr celui où \(V\) est formé de tous les vecteurs de \(\mathbb{R}^n\). Dans ce cas l'addition et la multiplication par un scalaire avaient été définis de façon naturelle, à savoir composante par composante (voir la Proposition dans la Section (cliquer)). C'est souvent le même procédé qui est utilisé dans des cas plus généraux.

Espaces de fonctions

Dans ce premier exemple, nous allons voir comment des ensembles de fonctions peuvent aussi être vus comme des espaces vectoriels.

Soit \(I \subseteq \mathbb{R}\) un intervalle (borné ou non, \(I\) peut même être la droite toute entière), et soit \(V\) l'ensemble de toutes les fonctions définies sur \(I\), à valeurs réelles: \[ V=\bigl\{\text{fonctions }f:I\to\mathbb{R}\bigr\}\,. \]

Nous devons maintenant vérifier que \(V\) est bien un espace vectoriel. Pour cela, nous aurons besoin de la fonction nulle \( \mathbf{0} : I \rightarrow \mathbb{R} \), comme étant la fonction qui vaut zéro en tout point, \[ \mathbf{0}(t):= 0\,,\quad\forall t\in I\,, \] et l'opposé d'une fonction \(f\in V\), notée \(-f\in V\), est la fonction \[ (-f)(t):= -f(t)\,,\quad\forall t\in I\,. \]

Preuve:

On vérifie une à une chacune des propriétés qui définissent un espace vectoriel. (On remarquera qu'à chaque fois, c'est une propriété des réels qui fait le travail!)

(EV.1) Soient \(f,g\in V\). Si on fixe \(t\in I\), on peut écrire \[ (f+g)(t)=f(t)+g(t)=g(t)+f(t)=(g+f)(t)\,. \] Comme cette identité est vraie pour tout \(t\in I\), cela implique bien que \(f+g=g+f\).
(EV.2) Soient \(f,g,h\in V\). Si on fixe \(t\in I\), alors \[\begin{aligned} \big(f+(g+h)\big)(t)&=f(t)+(g+h)(t)\\ &=f(t)+\big(g(t)+h(t)\big)\\ &=\big(f(t)+g(t)\big)+h(t)\\ &=(f+g)(t)+h(t)=\big((f+g)+h\big)(t)\,. \end{aligned}\] Comme cette identité est vraie pour tout \(t\in I\), cela implique bien que \(f+(g+h)=(f+g)+h\).
(EV.3) Par la définition de la fonction nulle, on a bien-sûr que \(f+\mathbf{0}=f\) pour toute \(f\in V\), puisque \[ (f+\mathbf{0})(t)=f(t)+\mathbf{0}(t)=f(t)\,,\qquad \forall t\in I\,. \]
(EV.4) Avec l'opposé \(-f\) défini plus haut, pour tout \(t\in I\), \[ \big(f+(-f)\big)(t)=f(t)+(-f)(t)=f(t)-f(t)=0=\mathbf{0}(t)\,, \] ce qui implique que \(f+(-f)=\mathbf{0}\).
(EV.5) Soient \(f,g\in V\), et soit \(\lambda\in \mathbb{R}\). Pour tout \(t\in I\), on a \[\begin{aligned} \big(\lambda(f+g)\big)(t) &=\lambda\big((f+g)(t)\big)\\ &=\lambda(f(t)+g(t))\\ &=\lambda f(t)+\lambda g(t)\\ &=(\lambda f)(t)+(\lambda g)(t)\\ &=(\lambda f+\lambda g)(t)\,, \end{aligned}\] ce qui implique \(\lambda(f+g)=\lambda f+\lambda g\).
(EV.6) Soient \(\lambda,\mu\in \mathbb{R}\), et \(f\in V\). On a, pour tout \(t\in I\), \[\begin{aligned} \big((\lambda+\mu)f\big)(t)&=(\lambda+\mu)f(t)\\ &=\lambda f(t)+\mu f(t)\\ &=(\lambda f)(t)+(\mu f)(t)\\ &=(\lambda f+\mu f)(t)\,, \end{aligned}\] ce qui implique bien que \((\lambda+\mu)f=\lambda f+\mu f\).
(EV.7) Soient \(\lambda,\mu\in \mathbb{R}\), \(f\in V\). On a, pour tout \(t\in I\), \[\begin{aligned} \big(\lambda(\mu f)\big)(t)&=\lambda\big((\mu f)(t)\big) \\ &= \lambda\big(\mu f(t)\big)\\ &=(\lambda\mu)f(t)\\ &=(\mu\lambda)f(t)\\ &=\mu\big(\lambda f(t)\big)\\ &=\mu\big((\lambda f)(t)\big)\\ &=\big(\mu(\lambda f)\big)(t)\,, \end{aligned}\] ce qui implique bien que \(\lambda(\mu f)=(\lambda\mu)f=\mu(\lambda f)\).
(EV.8) Soit \(f\in V\). On a, pour tout \(t\in I\), \[ (1f)(t)=1\cdot f(t)=f(t)\,, \] ce qui implique bien \(1f=f\).

Espaces de polynômes

Les fonctions polynomiales (que l'on appelle aussi polynômes) sont des fonctions très particulières mais fournissent un cas important d'espace vectoriel, jouant un rôle important dans de nombreuses applications. On rappelle qu'une fonction polynomiale (à coefficients réels) est une application \(p : \mathbb{R} \rightarrow \mathbb{R}\) pour laquelle il existe \(a_0, \dots, a_n \in \mathbb{R}\) tels que \[ p(t)=a_0+a_1t+a_2t^2+\dots+a_nt^n\,,\qquad t\in \mathbb{R}\,. \] On appelle \(a_0, \dots, a_n \in \mathbb{R}\) les coefficients de \(p\). Comme d'habitude, pour le polynôme \(p\) précédent on peut définir aussi les coefficients \(a_m = 0\) pour tout entier \(m > n\). Par exemple, la fonction nulle \(\mathbf{0}\) est ainsi une fonction polynomiale avec tous les coefficients zéro. On rappelle le résultat fondamental suivant.

Preuve:

Voir par exemple ici.

On dit que le polynôme \(p(t)=a_0+a_1t+a_2t^2+\dots+a_nt^n\) avec \(a_n \neq 0\) pour un entier non négatif \(n\) a degré \(n\). On définit que le degré du polynôme nul est \( -\infty\), et donc inférieur à tout entier \(n \geqslant 0\).

On définit \(\mathbb{P}\) l'ensemble de tous les polynômes à coefficients réels. Pour \(n\geqslant 0\) entier, on définit \(\mathbb{P}_n\) l'ensemble de tous les polynômes à coefficients réels de degré au plus égal à \(n\). On additionne et multiplie (par des scalaires) des polynômes de degré au plus égal à \(n\) comme on l'a fait pour les fonctions.

Preuve:

(voir exercices)

Espace des matrices

On rappelle qu'une matrice de taille \(m\times n\) à coefficients réels est un tableau rectangulaire formé de \( m\) lignes et \(n\) colonnes de la forme \[ A=\begin{pmatrix} A_{1,1} & \cdots & A_{1,n} \\ \vdots & \ddots & \vdots \\ A_{m,1} & \cdots & A_{m,n} \end{pmatrix} \] avec \(A_{i,j} \in \mathbb{R}\) pour tous \(1 \leqslant i \leqslant m\) et \(1 \leqslant j \leqslant n\). Les éléments \(a_{i,j}\) sont appelés les coefficients de la matrice \(A\). On note \(\mathbb{M}_{m\times n}(\mathbb{R})\) l'ensemble formé de toutes les matrices de taille \(m \times n\) à coefficients réels. Pour réduire l'écriture, si une matrice \(A\in \mathbb{M}_{m\times n}(\mathbb{R})\) a des coefficients \(A_{i,j}\) (\(i=1,\dots,m\), \(j=1,\dots,n\)), on écrira souvent tout simplement \[ A=(A_{i,j})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}, \qquad \text{ ou même } \qquad A=(A_{i,j}) \] si le rang des indices \(i\) et \( j \) est clair. Pour simplifier, on omettra souvent la virgule dans les indices des coefficients, i.e. on écrira souvent \(A_{ij}\) au lieu de \(A_{i,j}\). Une matrice de taille \(n \times n\) est dite carrée de taille \(n\). On écrira souvent \(\mathbb{M}_{n}(\mathbb{R})\) au lieu de \(\mathbb{M}_{n \times n}(\mathbb{R})\) l'ensemble formé de toutes les matrices carrées de taille \(n\) à coefficients réels. On rappelle les définitions d'addition et de multiplication par un scalaire, introduites précédemment:

Preuve:

En exercice! L'élément nul ''\(\mathbf{0}\)'' est la matrice de taille \(m\times n\) dont tous les éléments sont égaux à zéro, et l'opposé d'une matrice \(A\) est la matrice dont tous les éléments sont les opposés de ceux de \(A\).

Autres exemples

Exemple: Soit \(V\) l'ensemble des suites de réels, dans lequel une suite est notée simplement \(\boldsymbol{x}=(x_n)_{n\geqslant 0}\). En définissant une multiplication par un scalaire \(\lambda\in\mathbb{R}\), \[ \lambda \boldsymbol{x}:= (\lambda x_n)_{n\geqslant 0}\,, \] et l'addition \[ \boldsymbol{x}+\boldsymbol{y}:= (x_n+y_n)_{n\geqslant 0}\,, \] on peut vérifier (en exercice) que \(V\) a une structure d'espace vectoriel.

4.2 Définition et exemples

Espaces \(\mathbb{R}^n\)

Espaces de fonctions

Espaces de polynômes

Espace des matrices

Autres exemples