1 Invertibilità

Lezione 14

1 Invertibilità

In questa lezione affronteremo il problema dell’invertibilità di una funzione lineare o, equivalentemente, di una matrice e descriveremo un algoritmo per calcolare l’inversa di una matrice.

Una funzione lineare $f\colon V\to W$ è invertibile se esiste una funzione lineare $g\colon W\to V$ tale che $g\circ f={\rm id}_{V}$ e $f\circ g={\rm id}_{W}$ . Può accadere che $f$ non sia invertibile ma che esista comunque una funzione lineare $g\colon W\to V$ tale che $g\circ f={\rm id}_{V}$ (in tal caso non si potrà però avere anche $f\circ g={\rm id}_{W}$ , altrimenti $f$ sarebbe invertibile); oppure potrebbe essere $f\circ g={\rm id}_{W}$ ma non $g\circ f={\rm id}_{V}$ . Una funzione $g$ siffatta non è l’inversa di $f$ , ma si comporta come tale solo da sinistra oppure solo da destra.

Definizione. Sia $f\colon V\to W$ una funzione lineare. Se esiste una funzione lineare $g\colon W\to V$ tale che $g\circ f={\rm id}_{V}$ , tale $g$ è detta una inversa sinistra di $f$ . Se si ha invece $f\circ g={\rm id}_{W}$ , $g$ è detta una inversa destra di $f$ .

Può accadere che una funzione lineare ammetta un’inversa sinistra ma non un’inversa destra, oppure un’inversa destra ma non un’inversa sinistra. Tuttavia se esistono sia un’inversa sinistra che un’inversa destra di $f$ queste devono necessariamente essere uguali e, in tal caso, $f$ è invertibile.

Supponiamo infatti che $g_{s}$ sia un’inversa sinistra e che $g_{d}$ sia un’inversa destra di $f$ . Per la proprietà associativa della composizione di funzioni, si ha

(g_{s}\circ f)\circ g_{d}=g_{s}\circ(f\circ g_{d})

Ma $g_{s}\circ f={\rm id}_{V}$ e $f\circ g_{d}={\rm id}_{W}$ , perché $g_{s}$ e $g_{d}$ sono, rispettivamente, un’inversa sinistra e un’inversa destra di $f$ . L’uguaglianza precedente diventa quindi

{\rm id}_{V}\circ g_{d}=g_{s}\circ{\rm id}_{W}

da cui segue $g_{d}=g_{s}$ .

Il risultato seguente chiarisce sotto quali condizioni una funzione lineare ammette un’inversa sinistra oppure destra.

Teorema. Sia $f\colon V\to W$ una funzione lineare.

1.

Esiste un’inversa sinistra di $f$ se e solo se $f$ è iniettiva.
2.

Esiste un’inversa destra di $f$ se e solo se $f$ è suriettiva.

Dimostrazione. (1) Supponiamo che esista un’inversa sinistra $g_{s}$ di $f$ , cioè una funzione $g_{s}\colon W\to V$ tale che $g_{s}\circ f={\rm id}_{V}$ . Per dimostrare che $f$ è iniettiva basta dimostrare che ${\rm Ker}(f)=\{0\}$ . Sia dunque $v\in{\rm Ker}(f)$ . Si ha:

v={\rm id}_{V}(v)=(g_{s}\circ f)(v)=g_{s}(f(v))=g_{s}(0)=0.

Questo dimostra che l’unico vettore $v$ che appartiene al nucleo di $f$ è il vettore nullo, quindi ${\rm Ker}(f)=\{0\}$ e, di conseguenza, $f$ è iniettiva.

Viceversa, supponiamo che $f$ sia iniettiva e cerchiamo di costruire una sua inversa sinistra $g_{s}$ . Fissiamo una base $\{v_{1},\dots,v_{n}\}$ di $V$ . Sappiamo che l’insieme dei vettori $\{w_{1}=f(v_{1}),w_{2}=f(v_{2}),\dots,w_{n}=f(v_{n})\}$ è un insieme libero (perché $f$ è iniettiva), quindi possiamo completarlo a una base $\{w_{1},\dots,w_{n},w_{n+1},\dots,w_{n+r}\}$ di $W$ . Per definire la funzione lineare $g_{s}\colon W\to V$ è sufficiente specificare le immagini dei vettori della base $\{w_{1},\dots,w_{n},w_{n+1},\dots,w_{n+r}\}$ di $W$ . Definiamo quindi $g_{s}$ ponendo $g_{s}(w_{i})=v_{i}$ , per $i=1,\dots,n$ e $g_{s}(w_{n+1})=g_{s}(w_{n+2})=\cdots=g_{s}(w_{n+r})=0$ . Verifichiamo ora che la funzione $g_{s}$ così definita è un’inversa sinistra di $f$ . Sia $v=\lambda_{1}v_{1}+\cdots+\lambda_{n}v_{n}\in V$ , si ha:

	$\displaystyle(g_{s}\circ f)(v)$	$\displaystyle=g_{s}(f(v))=g_{s}\left(f\left(\sum_{i=1}^{n}\lambda_{i}\,v_{i}% \right)\right)=g_{s}\left(\sum_{i=1}^{n}\lambda_{i}\,f(v_{i})\right)$
		$\displaystyle=g_{s}\left(\sum_{i=1}^{n}\lambda_{i}\,w_{i}\right)=\sum_{i=1}^{n% }\lambda_{i}\,g_{s}(w_{i})=\sum_{i=1}^{n}\lambda_{i}\,v_{i}=v.$

Poiché questa uguaglianza vale per ogni $v\in V$ , si ha che $g_{s}\circ f={\rm id}_{V}$ , il che dimostra che $g_{s}$ è un’inversa sinistra di $f$ .

(2) Supponiamo che esista un’inversa destra $g_{d}$ di $f$ , cioè una funzione $g_{d}\colon W\to V$ tale che $f\circ g_{d}={\rm id}_{W}$ . Dato $w\in W$ poniamo $v=g_{d}(w)$ . Si ha:

f(v)=f(g_{d}(w))=(f\circ g_{d})(w)={\rm id}_{W}(w)=w,

il che significa che $w\in{\rm Im}(f)$ e dunque $f$ è suriettiva.

Viceversa, supponiamo che $f$ sia suriettiva e cerchiamo di costruire una sua inversa destra $g_{d}$ . Fissiamo una base $\{w_{1},\dots,w_{m}\}$ di $W$ . Dato che $f$ è suriettiva, per ogni $w_{j}$ ( $j=1,\dots,m$ ) esiste un vettore $v_{j}\in V$ tale che $f(v_{j})=w_{j}$ . Poiché per definire una funzione lineare è sufficiente specificare le immagini dei vettori di una base del dominio, possiamo definire $g_{d}\colon W\to V$ ponendo $g_{d}(w_{j})=v_{j}$ , per $j=1,\dots,m$ . Verifichiamo ora che la funzione $g_{d}$ così definita è un’inversa destra di $f$ . Sia $w=\mu_{1}w_{1}+\cdots+\mu_{m}w_{m}\in W$ , si ha:

	$\displaystyle(f\circ g_{d})(w)$	$\displaystyle=f(g_{d}(w))=f\left(g_{d}\left(\sum_{j=1}^{m}\mu_{j}\,w_{j}\right% )\right)=f\left(\sum_{j=1}^{m}\mu_{j}\,g_{d}(w_{j})\right)$
		$\displaystyle=f\left(\sum_{j=1}^{m}\mu_{j}\,v_{j}\right)=\sum_{j=1}^{m}\mu_{j}% \,f(v_{j})=\sum_{j=1}^{m}\mu_{j}\,w_{j}=w.$

Poiché questa uguaglianza vale per ogni $w\in W$ , si ha che $f\circ g_{d}={\rm id}_{W}$ , il che dimostra che $g_{d}$ è un’inversa destra di $f$ .

1.1 Calcolo dell’inversa di una matrice

Vogliamo ora descrivere un algoritmo, derivato dal metodo di eliminazione di Gauss, per il calcolo dell’inversa di una matrice quadrata. Tale algoritmo si basa sull’osservazione che effettuare delle operazioni elementari sulle righe di una matrice $A$ equivale a moltiplicare $A$ , a sinistra, per un’opportuna matrice invertibile.

Consideriamo, ad esempio, l’operazione che consiste nello scambio di due righe della matrice $A$ . Per ogni $i,j=1,\dots,n$ , con $i\neq j$ , indichiamo con $P(i,j)$ la matrice i cui elementi $p_{h,k}$ (con $1\leq h,k\leq n$ ) sono dati da:

p_{h,k}=\begin{cases}1&\text{se $h=k$, $h\neq i$, $h\neq j$},\\ 1&\text{se $h=i$ e $k=j$ oppure se $h=j$ e $k=i$},\\ 0&\text{altrimenti}.\end{cases}

Se $A$ è una matrice $n\times n$ e se poniamo $A^{\prime}=P(i,j)A$ , si verifica facilmente che la matrice $A^{\prime}$ è ottenuta dalla matrice $A$ semplicemente scambiando tra loro le righe $i$ -esima e $j$ -esima. Ad esempio, se $n=4$ , $i=1$ , $j=3$ , si ha

P(1,3)=\begin{pmatrix}0&0&1&0\\ 0&1&0&0\\ 1&0&0&0\\ 0&0&0&1\end{pmatrix}

\begin{pmatrix}0&0&1&0\\ 0&1&0&0\\ 1&0&0&0\\ 0&0&0&1\end{pmatrix}\cdot\begin{pmatrix}a_{1,1}&a_{1,2}&a_{1,3}&a_{1,4}\\ a_{2,1}&a_{2,2}&a_{2,3}&a_{2,4}\\ a_{3,1}&a_{3,2}&a_{3,3}&a_{3,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}=\begin{pmatrix}a_{3,1}&a_{3,2}&a_% {3,3}&a_{3,4}\\ a_{2,1}&a_{2,2}&a_{2,3}&a_{2,4}\\ a_{1,1}&a_{1,2}&a_{1,3}&a_{1,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}

Da quanto appena detto segue immediatamente che

P(i,j)^{2}=P(i,j)P(i,j)=I,

quindi le matrici $P(i,j)$ sono invertibili.

Consideriamo ora la matrice $M(i;\lambda)=(m_{h,k})$ definita, per ogni $i=1,\dots,n$ e ogni $\lambda\in K$ , $\lambda\neq 0$ , ponendo

m_{h,k}=\begin{cases}1&\text{se $h=k$, $h\neq i$},\\ \lambda&\text{se $h=k=i$},\\ 0&\text{altrimenti}.\end{cases}

La moltiplicazione a sinistra di $M(i;\lambda)$ per una matrice $A$ ha come effetto quello di moltiplicare la $i$ -esima riga di $A$ per $\lambda$ . Ad esempio, se $n=4$ e $i=2$ , si ha

M(2;\lambda)=\begin{pmatrix}1&0&0&0\\ 0&\lambda&0&0\\ 0&0&1&0\\ 0&0&0&1\end{pmatrix}

\begin{pmatrix}1&0&0&0\\ 0&\lambda&0&0\\ 0&0&1&0\\ 0&0&0&1\end{pmatrix}\cdot\begin{pmatrix}a_{1,1}&a_{1,2}&a_{1,3}&a_{1,4}\\ a_{2,1}&a_{2,2}&a_{2,3}&a_{2,4}\\ a_{3,1}&a_{3,2}&a_{3,3}&a_{3,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}=\begin{pmatrix}a_{1,1}&a_{1,2}&a_% {1,3}&a_{1,4}\\ \lambda a_{2,1}&\lambda a_{2,2}&\lambda a_{2,3}&\lambda a_{2,4}\\ a_{3,1}&a_{3,2}&a_{3,3}&a_{3,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}

Notiamo che, poiché si è supposto $\lambda\neq 0$ , si ha

M(i;\lambda)M(i;\lambda^{-1})=I,

quindi le matrici $M(i;\lambda)$ sono invertibili.

Infine, per ogni $i,j=1,\dots,n$ , con $i\neq j$ , e ogni $\alpha\in K$ , definiamo una matrice $S(i,j;\alpha)=(s_{h,k})$ ponendo

s_{h,k}=\begin{cases}1&\text{se $h=k$},\\ \alpha&\text{se $h=i$ e $k=j$},\\ 0&\text{altrimenti}.\end{cases}

Se $A$ è una matrice $n\times n$ e se poniamo $A^{\prime}=S(i,j;\alpha)A$ , è immediato verificare che la matrice $A^{\prime}$ è ottenuta dalla matrice $A$ sommando alla $i$ -esima riga la $j$ -esima moltiplicata per $\alpha$ . Ad esempio, se $n=4$ , $i=2$ , $j=4$ , si ha

S(2,4;\alpha)=\begin{pmatrix}1&0&0&0\\ 0&1&0&\alpha\\ 0&0&1&0\\ 0&0&0&1\end{pmatrix}

\begin{pmatrix}1&0&0&0\\ 0&1&0&\alpha\\ 0&0&1&0\\ 0&0&0&1\end{pmatrix}\cdot\begin{pmatrix}a_{1,1}&a_{1,2}&a_{1,3}&a_{1,4}\\ a_{2,1}&a_{2,2}&a_{2,3}&a_{2,4}\\ a_{3,1}&a_{3,2}&a_{3,3}&a_{3,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}=\\ =\begin{pmatrix}a_{1,1}&a_{1,2}&a_{1,3}&a_{1,4}\\ a_{2,1}+\alpha a_{4,1}&a_{2,2}+\alpha a_{4,2}&a_{2,3}+\alpha a_{4,3}&a_{2,4}+% \alpha a_{4,4}\\ a_{3,1}&a_{3,2}&a_{3,3}&a_{3,4}\\ a_{4,1}&a_{4,2}&a_{4,3}&a_{4,4}\end{pmatrix}

Si ha pertanto

S(i,j;\alpha)S(i,j;-\alpha)=I,

quindi le matrici $S(i,j;\alpha)$ sono invertibili.

Una successione di operazioni elementari sulle righe di una matrice $A$ equivale dunque a una successione di moltiplicazioni, a sinistra, per delle matrici invertibili del tipo descritto in precedenza. Poiché il prodotto di un numero qualsiasi di matrici invertibili è ancora una matrice invertibile, concludiamo che l’effetto di un numero qualunque di operazioni elementari sulle righe di una matrice $A$ può essere ottenuto semplicemente moltiplicando la matrice $A$ , a sinistra, per un’opportuna matrice invertibile.

Osservazione. Si verifica facilmente che moltiplicare una matrice $A$ a destra per le matrici $P(i,j)$ , $M(i;\lambda)$ e $S(i,j;\alpha)$ descritte in precedenza equivale ad effettuare delle operazioni elementari sulle colonne di $A$ . Più precisamente, se poniamo $A^{\prime}=AP(i,j)$ , la matrice $A^{\prime}$ è ottenuta scambiando tra loro la $i$ -esima e la $j$ -esima colonna di $A$ , se $A^{\prime}=AM(i;\lambda)$ allora $A^{\prime}$ è ottenuta moltiplicando per $\lambda$ la $i$ -esima colonna di $A$ , e se $A^{\prime}=AS(i,j;\alpha)$ allora $A^{\prime}$ è ottenuta dalla matrice $A$ sommando alla $j$ -esima colonna la $i$ -esima colonna moltiplicata per $\alpha$ . Pertanto, l’effetto di un numero qualunque di operazioni elementari sulle colonne di $A$ può essere ottenuto moltiplicando la matrice $A$ , a destra, per un’opportuna matrice invertibile.

Supponiamo ora che la matrice quadrata $A$ , di ordine $n$ , sia invertibile. Tramite operazioni elementari sulle righe è possibile trasformare $A$ in una matrice nella forma a scala, in cui il primo elemento non nullo di ciascuna riga può essere reso uguale a $1$ . Poiché $A$ è invertibile, il suo rango deve essere $n$ , quindi nella forma a scala non ci devono essere righe interamente nulle. Poiché $A$ è una matrice quadrata di ordine $n$ ciò equivale a dire che la forma a scala che otteniamo dopo l’applicazione dell’algoritmo di eliminazione di Gauss è una matrice $A^{\prime}$ , triangolare superiore, con tutti gli elementi sulla diagonale principale uguali a $1$ .

Arrivati a questo punto è facile convincersi che, mediante opportune operazioni elementari sulle righe della matrice $A^{\prime}$ , è possibile trasformare quest’ultima nella matrice identica $I$ . Se indichiamo con $B$ la matrice che rappresenta l’effetto di tutte le operazioni elementari sulle righe che abbiamo eseguito per trasformare la matrice $A$ nella matrice identica, si ha dunque $BA=I$ . La matrice $B$ è pertanto l’inversa della matrice $A$ . Essa può quindi essere determinata tenendo scrupolosamente conto di tutte le matrici corrispondenti alle operazioni elementari sulle righe che sono state effettuate.

Un metodo molto più efficace per determinare la matrice $B$ è il seguente. Scriviamo a fianco della matrice $A$ la matrice identica $I$ , in modo da ottenere una matrice con $n$ righe e $2n$ colonne che indicheremo con $(A\,|\,I)$ . In questo modo tutte le operazioni che eseguiremo sulle righe di $A$ dovranno essere effettuate anche sulle righe della matrice $I$ . L’effetto di queste operazioni elementari è equivalente alla moltiplicazione a sinistra per la matrice (incognita) $B$ . Si ha pertanto:

B\,(A\,|\,I)=(B\,A\,|\,B\,I)=(I\,|\,B).

Ciò significa che quando avremo trasformato la matrice $A$ nella matrice identica, la matrice $I$ scritta a destra di $A$ sarà stata automaticamente trasformata nella matrice $B$ , la quale non è altro che l’inversa di $A$ .

A titolo di esempio, applichiamo l’algoritmo appena descritto per determinare l’inversa della matrice

A=\begin{pmatrix}1&2&1\\ 1&3&0\\ 1&2&2\end{pmatrix}

Per prima cosa affianchiamo alla matrice $A$ la matrice identica, ottenendo

\begin{pmatrix}1&2&1&\vrule&1&0&0\\ 1&3&0&\vrule&0&1&0\\ 1&2&2&\vrule&0&0&1\end{pmatrix}

A questo punto, utilizzando operazioni elementari sulle righe, cerchiamo di trasformare la matrice $A$ nella matrice identica. Se riusciamo a fare ciò, la matrice che troveremo a destra sarà la matrice inversa di $A$ .

In dettaglio le operazioni da fare sono, ad esempio, le seguenti: sottraiamo alla seconda riga la prima, e alla terza riga la prima, ottenendo

\begin{pmatrix}1&2&1&\vrule&1&0&0\\ 0&1&-1&\vrule&-1&1&0\\ 0&0&1&\vrule&-1&0&1\end{pmatrix}

Ora sommiamo alla seconda riga la terza, mentre alla prima sottraiamo la terza, ottenendo

\begin{pmatrix}1&2&0&\vrule&2&0&-1\\ 0&1&0&\vrule&-2&1&1\\ 0&0&1&\vrule&-1&0&1\end{pmatrix}

Ora sommiamo alla prima riga la seconda moltiplicata per $-2$ , ottenendo

\begin{pmatrix}1&0&0&\vrule&6&-2&-3\\ 0&1&0&\vrule&-2&1&1\\ 0&0&1&\vrule&-1&0&1\end{pmatrix}

Si ha pertanto

A^{-1}=\begin{pmatrix}6&-2&-3\\ -2&1&1\\ -1&0&1\end{pmatrix}

Come esercizio si verifichi che la matrice appena trovata è effettivamente l’inversa di $A$ , cioè che $A\,A^{-1}=I$ .

Osservazione. Se la matrice $A$ di cui si cerca l’inversa non fosse invertibile essa avrebbe rango strettamente minore di $n$ , quindi la sua forma a scala $A^{\prime}$ , ottenuta nella prima parte dell’algoritmo precedentemente descritto, avrebbe almeno una riga interamente nulla. Ci accorgeremmo così che $A$ non è invertibile.