III. Espaces de Hilbert

Plan du site

Préhilbertien, hilbertien et hermitien. Espaces classiques. Orthogonalité (base préhilbertienne, procédé d'ortho­normali­sation de Schmidt. Opérateurs adjoints.

1. Préhilbertien, hilbertien et hermitien

Par définition, un espace préhilbertien est un espace vectoriel muni d’un produit scalaire. Un espace de Hilbert est un espace préhilbertien qui est complet pour la norme associée au produit scalaire.

En algèbre, on utilise surtout les espaces hermitiens de dimension finie. En analyse, ce sont les espaces hermitiens de dimension infinie qui interviennent dans la plupart des questions. On est amené à supposer que ces espaces sont complets, c’est à dire que toute suite de Cauchy est convergente. Un espace hermitien complet est dit hilbertien. Tout espace hermitien de dimension finie est hilbertien.

2. Positionnement de quelques espaces classiques

Deux exemples sont intéressants en raison de leur importance capitale en analyse fonctionnelle.

1) Soit \(I\) un intervalle de \(\mathbb{R}\) (ensemble des réels) non réduit à un point. Soit p une fonction à valeurs réelles continue sur \(I\), prenant des valeurs strictement positives en tout point intérieur à \(I\). Soit \(C(I,p)\) l’espace vectoriel des fonctions continues sur \(I\) à valeurs complexes telles que : \[\int_t{|f(t)|}^2~p(t)~dt~<~+\infty\]

Pour tout couple \((f,g)\) d’éléments de cet espace vectoriel, le produit \(f.g.p\) est intégrable sur \(I\).

Muni de l’application : \[(f,g)\mapsto \int_t f(t)~\overline{g(t)}~p(t)~dt\]

\(C(I,p)\) est un espace hermitien, mais ce n’est pas un espace hilbertien.

2) En revanche, l’espace vectoriel \(L^2(I,p)\) des classes de fonctions \(f\) à valeurs complexes, mesurables sur \(I\) et telles que : \[\int_t{|f(t|}^2~p(t)~dt~<~+\infty\]

muni de l’application : \[(f,g)\mapsto \int_t f(t)~\overline{g(t)}~p(t)~dt\]

est hilbertien.

2.1. Produit scalaire usuel dans \(C^n\)

Avec \(x=\{x_1,x_2,..,x_n\}\) et \(y=\{y_1,y_2,..,y_n\}\) : \[(x|y)=\sum_k\overline{x_k}~y_k\]

Inégalité de Schwartz

\[\left|\sum_{k=1}^n\overline{x_k}~y_k\right|=\sqrt{\sum_{k=1}^n{|\overline{x_k}|}^2}~\sqrt{\sum_{k=1}^n{|\overline{y_k}|}^2}\] \(C^n\) est un espace de Hilbert de dimension finie.

2.2. Espace des fonctions de carré intégrable

Soit \(X=]A,B[\) un intervalle de \(\mathbb{R}\) (borné ou non) et \(W~:~X\rightarrow~]0,\infty[\) une fonction continue. L’ensemble des fonctions \(f\) telles que : \[\int_a^b{|f(x)|}^2~W(x)~dx~<~+\infty\]

est noté \(L^2(X,W~dx)\) ou \(L^2(X,W)\) C’est un espace vectoriel.

Soient à présent \(f,g\in L^2(X,W)\). La norme de \(f\) s’écrira : \[\|f\|=\sqrt{\int_a^b{|f(x)|}^2~W(x)~dx}\]

\(L^2(X,Wdx)\) est un espace de Hilbert : l’espace des fonctions de carré intégrable pour la mesure \(W~dx\).

3. Orthogonalité

3.1. Définitions et propriétés

Sous-espace orthogonal

On dit que deux vecteurs \(x,y\) d’un espace hermitien E sont orthogonaux si leur produit hermitien est nul : \((x|y)=0\).

Cette relation est symétrique puisque \((y|x)=\overline{(x|y)}\).

On dit que deux parties \(A,B\subset E\) sont orthogonales si \(\forall x\in A\) et \(\forall y\in B\), on a \((x|y)=0\).

L’ensemble noté \(A^{\bot}\) des vecteurs orthogonaux à une partie \(A\subset E\) est un sous-espace vectoriel fermé de E, appelé orthogonal de A.

L’orthogonal de E est réduit au vecteur nul.

Sous-espace supplémentaire orthogonal

Soit F un sous-espace vectoriel de E. On dit que F admet un supplémentaire s’il existe un sous-espace vectoriel \(G\subset E\) tel que \(E=F\oplus G\), c’est-à-dire si tout vecteur de E s’écrit de manière unique comme la somme d’un vecteur de F et d’un vecteur de G : \[\forall x \in E, \quad \exists~(u,v) \in F \times G, \qquad x = u+v\]

Dans le cas où \(G=F^{\bot}\), nous dirons alors que le sous-espace \(F^{\bot}\) est le supplémentaire orthogonal de F dans E.

On écrit alors : \[E=F\oplus F^{\bot}\qquad\text{avec}\qquad F\cap F^{\bot}=\{0\}\]

La projection de \(x\in E\) sur F parallèlement à G s’appelle projection orthogonale de \(x\) sur F.

Réciprocité de l’orthogonalité

Sous ces mêmes hypothèses \((F^{\bot})^{\bot}=F\).

En effet, il est bien évident que \(x\in (F^{\bot})^{\bot}\supset F\) .

Soit donc un élément \(x\in (F^{\bot})^{\bot}\). Écrivons ce vecteur sous la forme : \[x=y+z\qquad\text{avec}\qquad y\in F^{\bot}\qquad\text{et}\qquad z\in F\]

Il s’ensuit que : \[(x|y)=(y|y)+(z|y)\quad \Rightarrow \quad (y|y)=0\]

Ainsi, \(y=0\) et \(x=z\) et on a bien \(x\in F\).

Projecteur orthogonal

Reprenons l’écriture : \[E=F\oplus F^{\bot}\qquad\text{avec}\qquad F\cap F^{\bot}=\{0\}\]

Si on désigne par \(P:~E\rightarrow F\) le projecteur correspondant à cette décomposition de E en somme directe, l’opérateur P possède les propriétés suivantes :

– Pour tout \(x\in E\), on a : \[\|x-P.x\|=d(x,F)\]

– Pour tout \(x\in E\) , \(P.x\) est le seul vecteur \(y\in F\) tel que \((x-y)\) soit orthogonal à F.

L’opérateur P s’appelle le projecteur orthogonal de E sur F.

Somme directe orthogonale

Soit maintenant \((F_i)_{i\in I}\) une famille de sous-espaces vectoriels de E orthogonaux deux à deux et F leur somme.

Alors cette somme est directe. C’est pourquoi l’on dit que F est la somme directe orthogonale des sous-espaces vectoriels \(F_i\) .

Généralisation du théorème de Pythagore

Soit \(S=(x_i)_{i\in I}\) une famille de vecteurs d’un espace hermitien E.

On dit que S est orthogonale si, pour tout couple \((i,j)\) d’éléments distincts de I, les vecteurs \((x_i,x_j)\) sont orthogonaux.

Dans ces conditions, pour toute partie finie \(J\subset I\) : \[{\left\|\sum_{i\in J}x_i\right\|}^2=\sum_{i\in J}{\|x_i\|}^2\]

On retrouve le théorème de Pythagore généralisé.

On dit que S est orthonormale si, de plus, pour tout élément \(i\in I\) , le vecteur est unitaire. La somme des droites est alors directe orthogonale.

3.2. Base hilbertienne

On dit enfin que S est une base hilbertienne de E si S est orthonormale et si le sous-espace vectoriel engendré par S est dense dans E. Cette notion est mieux adaptée à l’analyse que celle de base normale.

Un exemple type est lié de manière essentielle à la théorie des séries de Fourier. Soit C(T) l’espace vectoriel des fonctions continues sur \(\mathbb{R}\) à valeurs complexes et admettant 1 pour période, muni du produit hermitien : \[(f,g)\mapsto \int_0^1f(t)~\overline{g(t)}~dt\]

La famille \((e_n)_{n\in Z}\) des fonctions définies par les formules : \[e_n(t)=\exp (j~2\pi~n~t)\]

est une base hilbertienne de C(T).

Les éléments du sous-espace vectoriel engendré par S s’appellent polynômes trigonométriques.

L’espace hermitien C(T) n’est pas complet. Il peut s’identifier à un sous-espace vectoriel de l’espace hilbertien dense dans \(L^2(0,1)\). La famille \((e_n)_{n\in Z}\) apparaît alors comme une base hilbertienne de \(L^2(0,1)\) .

Pour mieux comprendre physiquement cet exemple, procédons de la manière suivante :

Soit E un espace préhilbertien et \((u_n)_{n>0}\) une suite orthonormée de vecteurs. Pour tout \(x\in E\) , \(c_n(x)=(u_n,x)\) est le coefficient \(n\) de \(x\) par rapport à la suite orthonormée \((u_n)_{n>0}\). Cette définition est liée à la théorie des séries de Fourier.

Si \(E=L^2(0,T)\), la suite de fonctions : \[u_n(t)=\frac{1}{\sqrt{T}}~\exp\left\{\frac{j~2\pi~n~t}{T}\right\}\qquad n\in Z\]

est orthonormée et pour tout \(f\in E\) : \[c_n(f)=\frac{1}{\sqrt{T}}\int_0^T\exp\left\{\frac{j~2\pi~n~t}{T}\right\}~f(t)~dt\]

Autrement dit, à un facteur constant près \((\sqrt{T})\) , \(c_n(f)\) est le coefficient de Fourier usuel de la série de Fourier.

3.3. Le procédé d’orthonormalisation de Schmidt

Soit E un espace hermitien, \((e_1,e_2,..,e_p)\) une famille orthonormale de vecteurs de E et F le sous espace vectoriel de E engendré par cette famille. On suppose que F est différent de E et on considère un vecteur \(x\in E,~x\notin F\) .

Il existe alors un vecteur \(e_{p+1}\in E\) et un seul tel que :

  • la famille (\(e_1,e_2,...,e_{p+1}\)) est orthonormale ;

  • le vecteur \(e_{p+1}\) appartient au sous-espace vectoriel \(F\oplus Cx\) ;

  • le scalaire \((e_{p+1}/x)\) est réel positif.

De plus, le vecteur \(e_{p+1}\) est donné par la formule : \[e_{p+1}=\frac{y}{\|y\|}\qquad\text{où}\qquad y=x-\sum_{j=1}^p(x/e_j)~e_j\]

Par récurrence, on déduit le théorème suivant :

Théorème

Soit \((x_n)_{n\in N}\) une famille libre d’éléments d’un espace hermitien E. Il existe alors une famille orthonormale et une seule \((e_n)_{n\in N}\) de vecteurs de E telle que, pour tout entier n, \((e_n)\) appartienne au sous-espace vectoriel engendré par les vecteurs \((x_0,x_1,..,x_n)\) et que \((x_n/e_n)\) soit réel positif.

On dit que \((e_n)_{n\in N}\) se déduit de \((x_n)_{n\in N}\) par orthonormalisation. Ces deux familles engendrent le même sous-espace vectoriel F de E.

En particulier, si \((x_n)_{n\in N}\) est totale, c’est à dire si F est dense dans E,\((e_n)_{n\in N}\) est une base hilbertienne de E. Il en résulte que tout espace hermitien séparable (c’est-à-dire admettant une famille de vecteurs totale dénombrable) admet une base hilbertienne dénombrable.

Application

Appliquons ces résultats à l’espace hermitien \(C(I,p)\) introduit plus haut, en supposant que, pour tout entier naturel n, la fonction \([x_n(t)\mapsto t^n]\) est un élément de \(C(I,p)\) . La famille \((e_n)\) déduite de \((x_n)_{n\in N}\) par orthonormalisation est constituée de fonctions polynômiales, \((e_n)\) étant de degré \(n\).

La famille \((e_n)\) s’appelle système de polynômes orthogonaux associé au poids \(p\) sur l’intervalle \(I\).

Lorsque l’intervalle est borné, \((x_n)_{n\in N}\) est une base hilbertienne de \(C(I,p)\) . Il en est de même lorsque \(I\) est non borné, s’il existe deux nombres réels strictement positifs \(\alpha,\beta\) tels que : \[\forall t\in I,\qquad p(t)\leq \beta~e^{-\alpha|t|}\]

Une application aux polynômes, très connue, est celle des polynômes d’Hermite pour lesquels on peut vérifier que :

\[\begin{aligned} &H_n(x)=(-1)^n~e^{-x^2}~\frac{d^n}{dx^n}~e^{-x^2}\\ &X=\mathbb{R} \qquad;\qquad W(x)=e^{-x^2}\\ &\int_{\mathbb{R}}~e^{-x^2}~H_m(x)~H_n(x)~dx~=~2^n~n!~\sqrt{\pi}~\delta_{mn}\end{aligned}\]

4. Opérateurs adjoints

Soit E un espace préhilbertien et A un opérateur dans E. On dit que A possède un adjoint s’il existe un opérateur (noté \(A^*\)) dans E tel que, pour tout \(x\in E\) et pour tout \(y\in E\), on ait : \[(A~x|y)=(x|A^*y)\]

On pourra vérifier les points suivants :

– Si \(A^*\) existe, il est unique et \((A^*)^*=A\).

– Si A et B sont deux opérateurs ayant pour adjoints respectifs \(A^*\) et \(B^*\), alors :

\[\begin{aligned} (A+\lambda B)^*&=A^*+\overline{\lambda}~B^*\\ (A~B)^*&=B^*A^*\end{aligned}\]

Propositions

Nous les énonçons sans démonstration :

  1. Soit A un opérateur continu possédant un adjoint \(A^*\), alors A est continu et \(\|A^*\|=\|A\|\).

    Si E est un espace de Hilbert, tout opérateur continu a un adjoint.

  2. Si A est un opérateur continu possédant un adjoint dans un espace préhilbertien, on a : \[\|A^*A\|=\|A~A^*\|=\|A^2\|={\|A^*\|}^2\]

  3. Soit E un espace préhilbertien, F un sous-espace vectoriel complet de E et P la projection orthogonale de E sur F, alors P est un opérateur auto-adjoint positif.

↑ Haut