Commençons par introduire la généralisation abstraite de la notion de vecteur
rencontrée dans les chapitres précédents:
Un espace vectoriel est un ensemble non-vide, noté souvent
\(V\), dont les éléments sont appelés vecteurs, notés souvent
\(u,v,w,\dots\)
,
muni d'une addition et
d'une
multiplication par un scalaire, satisfaisant aux propriétés suivantes:
\(u+v=v+u\) pour tous \(u,v\in V\) (commutativité)
\(u+(v+w)=(u+v)+w\) pour tous \(u,v,w\in V\) (associativité)
Il existe un vecteur nul, noté ''\(0\)'', tel que
pour tout \(v\in V\),
\[0+v=v+0=v\,.\]
Pour tout \(v\in V\), il existe un vecteur opposé, noté \(-v\), tel
que
\[v+(-v)=(-v)+v=0\,.\]
\(\lambda(u+v)=\lambda u+\lambda v\) pour tous \(\lambda\in \mathbb{R}\),
\(u,v\in V\)
\((\lambda+\mu)v=\lambda v+\mu v\) pour tous \(\lambda,\mu\in \mathbb{R}\),
\(v\in V\)
\(\lambda(\mu v)=(\lambda \mu)v=\mu(\lambda v)\) pour tous
\(\lambda,\mu\in \mathbb{R}\), \(v\in V\)
\(1v=v\) pour tout \(v\in V\)
Remarque:
Ce que l'on vient de définir est généralement appelé
espace vectoriel réel, car les scalaires utilisés pour
multiplier les vecteurs sont des nombres réels.
Donc un espace vectoriel est simplement un ensemble d'objets abstraits appelés
vecteurs, dans lequel un ''\(+\)'' permet d'additionner ces vecteurs,
et dans lequel on peut multiplier les vecteurs par des scalaires.
Cela peut prendre du temps de s'habituer à ce niveau d'abstraction, et
d'imaginer que ce genre de structure existe ailleurs que dans le cadre des
''flèches de \(\mathbb{R}^n\)''. C'est surtout à la fin du cours qu'on se rendra
compte de l'utilité de cette généralisation, lorsqu'on pourra résoudre des
problèmes concrets en appliquant des méthodes algébriques/géométriques
(par exemple: la méthode des moindres carrés) dans un espace vectoriel abstrait.
Voyons quelques-uns des principaux exemples d'espaces vectoriels.
Espaces \(\mathbb{R}^n\)
Le premier exemple d'espace vectoriel que nous avons rencontré est bien-sûr
celui où \(V\) est formé de tous les vecteurs de \(\mathbb{R}^n\).
Dans ce cas l'addition et la multiplication par un scalaire avaient été définis
de façon naturelle, à savoir composante par composante. C'est souvent
le même procédé qui est utilisé dans des cas plus généraux.
Espaces de fonctions
Dans ce premier exemple, nous allons voir comment des ensembles de
fonctions peuvent aussi être vus comme des espaces vectoriels.
Soit \(I\subset\mathbb{R}\) un intervalle (borné ou non, \(I\) peut même être la
droite toute entière), et
soit \(V\) l'ensemble de toutes les fonctions définies sur
\(I\), à valeurs réelles:
\[
V=\bigl\{\text{fonctions }f:I\to\mathbb{R}\bigr\}\,.
\]
Remarque:
Une fonction \(f\in V\) est définie une fois que l'on a
défini la valeur du réel \(f(t)\) pour chaque \(t\in I\).
Ainsi, deux fonctions \(f,g\in V\) sont égales, ce qu'on écrit
\(f=g\), si et seulement si
elles prennent la même valeur en tout point, c'est-à-dire si
\[ f(t)=g(t)\,,\quad \forall t\in I\,.
\]
Définissons une addition sur \(V\). Pour ce faire,
nous devons associer à toute paire
\(f,g\in V\) une nouvelle fonction \(f+g\in V\). On doit donc définir le réel
\((f+g)(t)\) pour tout \(t\in I\), ce que l'on fait naturellement en posant
\[
(f+g)(t):= f(t)+g(t)\,,\qquad \forall t\in I\,.
\]
Définissons la multiplication par un scalaire:
si \(f\in V\) et \(\lambda\in \mathbb{R}\), alors \(\lambda f \in V\)
est la fonction \(\lambda f:I\to \mathbb{R}\) définie comme suit:
\[ (\lambda f)(t):= \lambda f(t)\,,\qquad \forall t\in I\,.
\]
Nous devons maintenant vérifier que \(V\) est bien un espace vectoriel. Pour
cela, nous aurons besoin de
la fonction nulle \(0\in V\), comme étant
la fonction qui vaut zéro en tout point,
\[
0(t):= 0\,,\quad\forall t\in I\,,
\]
et l'opposé d'une fonction \(f\in V\), notée \(-f\in V\), est la fonction
\[
(-f)(t):= -f(t)\,,\quad\forall t\in I\,.
\]
Théorème:
Muni de l'addition et de la multiplication par un
scalaire (définies ci-dessus),
\(V\) est un espace vectoriel.
On vérifie une à une chacune des propriétés qui définissent un espace vectoriel.
(On remarquera qu'à chaque fois, c'est une propriété des réels qui fait le
travail!)
Soient \(f,g\in V\). Si on fixe \(t\in I\),
on peut écrire
\[
(f+g)(t)=f(t)+g(t)=g(t)+f(t)=(g+f)(t)\,.
\]
Comme cette identité est vraie pour tout \(t\in I\), cela implique bien que
\(f+g=g+f\).
Soient \(f,g,h\in V\). Si on fixe \(t\in I\), alors
\[\begin{aligned}
(f+(g+h))(t)&=f(t)+(g+h)(t)\\
&=f(t)+(g(t)+h(t))\\
&=(f(t)+g(t))+h(t)\\
&=(f+g)(t)+h(t)=((f+g)+h)(t)\,.
\end{aligned}\]
Comme cette identité est vraie pour tout \(t\in I\), cela implique bien que
\(f+(g+h)=(f+g)+h\).
Par la définition de la fonction nulle,
on a bien-sûr que \(f+0=f\) pour toute \(f\in V\), puisque
\[ (f+0)(t)=f(t)+0(t)=f(t)\,,\qquad \forall t\in I\,.
\]
Avec l'opposé \(-f\) défini plus haut, pour tout \(t\in I\),
\[
(f+(-f))(t)=f(t)+(-f)(t)=f(t)-f(t)=0=0(t)\,,
\]
ce qui implique que \(f+(-f)=0\).
Soient \(f,g\in V\), et soit \(\lambda\in \mathbb{R}\).
Pour tout \(t\in I\), on a
\[\begin{aligned}
(\lambda(f+g))(t)
&=\lambda((f+g)(t))\\
&=\lambda(f(t)+g(t))\\
&=\lambda f(t)+\lambda g(t)\\
&=(\lambda f)(t)+(\lambda g)(t)\\
&=(\lambda f+\lambda g)(t)\,,
\end{aligned}\]
ce qui implique \(\lambda(f+g)=\lambda f+\lambda g\).
Soient \(\lambda,\mu\in \mathbb{R}\), et \(f\in V\). On a, pour tout \(t\in I\),
\[\begin{aligned}
((\lambda+\mu)f)(t)&=(\lambda+\mu)f(t)\\
&=\lambda f(t)+\mu f(t)\\
&=(\lambda f)(t)+(\mu f)(t)\\
&=(\lambda f+\mu f)(t)\,,
\end{aligned}\]
ce qui implique bien que
\((\lambda+\mu)f=\lambda f+\mu f\).
Soient \(\lambda,\mu\in \mathbb{R}\), \(f\in V\). On a, pour tout \(t\in I\),
\[\begin{aligned}
(\lambda(\mu f))(t)&=\lambda((\mu f)(t))\\
&= \lambda(\mu f(t))\\
&=(\lambda\mu)f(t)\\
&=(\mu\lambda)f(t)\\
&=\mu(\lambda f(t))\\
&=\mu((\lambda f)(t))\\
&=(\mu(\lambda f))(t)\,,
\end{aligned}\]
ce qui implique bien que \(\lambda(\mu f)=(\lambda\mu)f=\mu(\lambda f)\).
Soit \(f\in V\). On a, pour tout \(t\in I\),
\[
(1f)(t)=1\cdot f(t)=f(t)\,,
\]
ce qui implique bien \(1f=f\).
La preuve est étonnamment longue, mais ne présente
aucune subtilité!
(La seule difficulté, peut-être, est de comprendre
pourquoi il est nécessaire de faire tout ça!)
Espaces de polynômes
Les polynômes sont des fonctions très particulières mais fournissent un cas
important d'espace vectoriel, jouant un rôle important
dans de nombreuses applications.
Soit \(n\geqslant 1\) un entier, et soit \(\mathbb{P}_n\)
l'ensemble de tous les polynômes réels de degré au plus égal à \(n\).
Cela signifie qu'un élément \(p\in \mathbb{P}_n\) est un polynôme de la forme
\[
p(t)=a_0+a_1t+a_2t^2+\dots+a_nt^n\,,\qquad t\in \mathbb{R}\,,
\]
où les coefficients \(a_0,a_1,\dots,a_n\) sont des réels.
On additionne et multiplie (par des scalaires) comme on l'a fait pour les
fonctions.
Théorème:
Muni de l'addition et de la multiplication par un
scalaire, \(\mathbb{P}_n\) est un espace vectoriel.
Considérons
l'ensemble des matrices \(m\times n\) à coefficients réels, noté
\(\mathbb{M}_{m\times n}(\mathbb{R})\).
Si une matrice \(A\in \mathbb{M}_{m\times n}(\mathbb{R})\) a des coefficients
\(a_{ij}\) (\(i=1,\dots,m\), \(j=1,\dots,n\)), on écrira simplement
\[
A=(a_{ij})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}
\]
On rappelle les définitions d'addition et de
multiplication par un scalaire, introduites précédemment:
Si \(A,B\in \mathbb{M}_{m\times n}(\mathbb{R})\),
\[
A=(a_{ij})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}\,,\qquad
B=(b_{ij})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}\,,
\]
on définit
\(A+B\in \mathbb{M}_{m\times n}(\mathbb{R})\) comme la matrice dont les éléments sont les
nombres \(a_{ij}+b_{ij}\):
\[
A+B:=(a_{ij}+b_{ij})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}\,.
\]
Pour un scalaire \(\lambda\in
\mathbb{R}\), on définit \(\lambda A\in \mathbb{M}_{m\times n}(\mathbb{R})\)
comme la matrice
dont les éléments sont les nombres \(\lambda a_{ij}\):
\[
\lambda A:=
(\lambda a_{ij})_{\substack{i=1,\dots,m\\ j=1,\dots,n}}\,.
\]
Théorème:
Muni de l'addition et de la multiplication par un
scalaire (définies ci-dessus),
\(\mathbb{M}_{m\times n}(\mathbb{R})\) est un espace vectoriel.
En exercice! L'élément nul ''\(0\)''
est la matrice \(m\times n\) dont tous les éléments sont égaux
à zéro, et l'opposé d'une matrice \(A\) est la matrice dont tous les éléments
sont les opposés de ceux de \(A\).
Autres exemples
La structure d'espace vectoriel apparaît dans de nombreuses situations.
Exemple:
Soit \(V\) l'ensemble des suites de réels, dans lequel une suite est
notée simplement \(\boldsymbol{x}=(x_n)_{n\geqslant 0}\). En définissant une multiplication
par un scalaire \(\lambda\in\mathbb{R}\),
\[ \lambda \boldsymbol{x}:= (\lambda x_n)_{n\geqslant 0}\,,
\]
et l'addition
\[ \boldsymbol{x}+\boldsymbol{y}:= (x_n+y_n)_{n\geqslant 0}\,,
\]
on peut vérifier (en exercice) que \(V\) a une structure d'espace vectoriel.
Quiz 4.2-1 :
Parmi les ensembles de vecteurs suivants, lesquels sont des espaces vectoriels?
\(V=\{\boldsymbol{0}\}\) (ne contient que le vecteur nul de \(\mathbb{R}^n\)).
\(V\) est l'ensemble des vecteurs de \(\mathbb{R}^2\) dont la norme
est égale à \(1\).
\(V\) est l'ensemble des vecteurs de \(\mathbb{R}^n\) colinéaires à
\[\boldsymbol{x}= \begin{pmatrix} 1\\ 1\\ \vdots\\ 1 \end{pmatrix} \]
Quiz 4.2-2 :
Parmi les ensembles de fonctions suivants, lesquels sont des espaces vectoriels?
\(V\) est l'ensemble des fonctions \(f:[a,b]\to\mathbb{R}\) telles que \(f(a)=0\).
\(V\) est l'ensemble des fonctions \(f:[a,b]\to\mathbb{R}\) telles que \(f(a)=-1\).
\(V\) est l'ensemble des fonctions \(f:[a,b]\to\mathbb{R}\) telles que \(f(a)=-f(b)\).
\(V\) est l'ensemble des fonctions \(f:[a,b]\to\mathbb{R}\) telles que \(f(a)f(b)=0\).
Quiz 4.2-3 :
Vrai ou faux?
Si \(V\) est un espace vectoriel dont les éléments sont des fonctions
\(f:\mathbb{R}\to \mathbb{R}\), alors pour tout \(f\in V\) on a que
\[
f(\alpha s+\beta t)=\alpha f(s)+\beta f(t)\qquad \forall \alpha,\beta,s,t\in
\mathbb{R}\,.
\]