Lezione 23


1 Il polinomio minimo di una matrice

Indichiamo con Mn⁒(K)subscript𝑀𝑛𝐾 l’anello delle matrici quadrate di ordine n𝑛 a elementi nel campo K𝐾. Data una matrice A∈Mn⁒(K)𝐴subscript𝑀𝑛𝐾 consideriamo l’omomorfismo di anelli

vA:K⁒[x]β†’Mn⁒(K):subscript𝑣𝐴→𝐾delimited-[]π‘₯subscript𝑀𝑛𝐾

definito dalla valutazione di un polinomio q⁒(x)π‘žπ‘₯ in A𝐴: vA⁒(q)=q⁒(A)subscriptπ‘£π΄π‘žπ‘žπ΄. Il nucleo di questo omomorfismo

Ker⁒(vA)={q⁒(x)∈K⁒[x]:q⁒(A)=0}Kersubscript𝑣𝐴conditional-setπ‘žπ‘₯𝐾delimited-[]π‘₯π‘žπ΄0

Γ¨ un ideale di K⁒[x]𝐾delimited-[]π‘₯. Ricordiamo che il teorema di Hamilton–Cayley afferma che il polinomio caratteristico pA⁒(x)subscript𝑝𝐴π‘₯ della matrice A𝐴 si annulla quando viene valutato in A𝐴, cioΓ¨ pA⁒(x)∈Ker⁒(vA)subscript𝑝𝐴π‘₯Kersubscript𝑣𝐴.

Dato che K𝐾 Γ¨ un campo, l’anello K⁒[x]𝐾delimited-[]π‘₯ Γ¨ un dominio di integritΓ  a ideali principali, pertanto l’ideale Ker⁒(vA)Kersubscript𝑣𝐴 Γ¨ generato da un polinomio mA⁒(x)subscriptπ‘šπ΄π‘₯, che possiamo supporre monico.

Definizione. Il polinomio mA⁒(x)subscriptπ‘šπ΄π‘₯ appena definito Γ¨ detto il polinomio minimo di A𝐴. Esso Γ¨ il polinomio monico di grado minimo che si annulla quando viene valutato in A𝐴.

Osservazione. Dato che il polinomio caratteristico pA⁒(x)subscript𝑝𝐴π‘₯ appartiene all’ideale Ker⁒(vA)Kersubscript𝑣𝐴, dalla definizione di mA⁒(x)subscriptπ‘šπ΄π‘₯ segue che il polinomio minimo mA⁒(x)subscriptπ‘šπ΄π‘₯ divide il polinomio caratteristico pA⁒(x)subscript𝑝𝐴π‘₯.

Come ora vedremo, il polinomio caratteristico e il polinomio minimo di una matrice A𝐴 hanno gli stessi zeri, che sono gli autovalori di A𝐴.

Teorema. Sia A∈Mn⁒(K)𝐴subscript𝑀𝑛𝐾. Si ha pA⁒(Ξ»)=0subscriptπ‘π΄πœ†0 se e solo se mA⁒(Ξ»)=0subscriptπ‘šπ΄πœ†0.

Dimostrazione. Dato che il polinomio minimo mA⁒(x)subscriptπ‘šπ΄π‘₯ divide il polinomio caratteristico pA⁒(x)subscript𝑝𝐴π‘₯, cioΓ¨ pA⁒(x)=mA⁒(x)⁒q⁒(x)subscript𝑝𝐴π‘₯subscriptπ‘šπ΄π‘₯π‘žπ‘₯, se λ∈Kπœ†πΎ Γ¨ tale che mA⁒(Ξ»)=0subscriptπ‘šπ΄πœ†0 si ha anche pA⁒(Ξ»)=0subscriptπ‘π΄πœ†0, cioΓ¨ gli zeri del polinomio minimo sono anche zeri del polinomio caratteristico. Rimane quindi da dimostrare il viceversa.

Sia λ∈Kπœ†πΎ tale che pA⁒(Ξ»)=0subscriptπ‘π΄πœ†0, cioΓ¨ Ξ»πœ† Γ¨ un autovalore di A𝐴. Sia K¯¯𝐾 un campo algebricamente chiuso che contiene K𝐾. In K¯¯𝐾 i polinomi minimo e caratteristico si fattorizzano nel prodotto di fattori lineari:

mA⁒(x)=∏j=1r(xβˆ’ΞΌj),pA⁒(x)=∏i=1n(xβˆ’Ξ»i),formulae-sequencesubscriptπ‘šπ΄π‘₯superscriptsubscriptproduct𝑗1π‘Ÿπ‘₯subscriptπœ‡π‘—subscript𝑝𝐴π‘₯superscriptsubscriptproduct𝑖1𝑛π‘₯subscriptπœ†π‘–

ove Ξ»isubscriptπœ†π‘– sono gli autovalori di A𝐴. Sia vβ‰ 0𝑣0 un autovettore associato all’autovalore Ξ»πœ† (quindi si ha A⁒v=λ⁒vπ΄π‘£πœ†π‘£).

Sappiamo che il polinomio minimo si annulla quando viene valutato nella matrice A𝐴, cioè

mA⁒(A)=∏j=1r(Aβˆ’ΞΌj⁒I)=0,subscriptπ‘šπ΄π΄superscriptsubscriptproduct𝑗1π‘Ÿπ΄subscriptπœ‡π‘—πΌ0

quindi si ha

∏j=1r(Aβˆ’ΞΌj⁒I)⁒v=(Aβˆ’ΞΌ1⁒I)⁒(Aβˆ’ΞΌ2⁒I)⁒⋯⁒(Aβˆ’ΞΌr⁒I)⁒v=0.superscriptsubscriptproduct𝑗1π‘Ÿπ΄subscriptπœ‡π‘—πΌπ‘£π΄subscriptπœ‡1𝐼𝐴subscriptπœ‡2𝐼⋯𝐴subscriptπœ‡π‘ŸπΌπ‘£0

Osserviamo che (Aβˆ’ΞΌr⁒I)⁒v=A⁒vβˆ’ΞΌr⁒v=λ⁒vβˆ’ΞΌr⁒v=(Ξ»βˆ’ΞΌr)⁒v𝐴subscriptπœ‡π‘ŸπΌπ‘£π΄π‘£subscriptπœ‡π‘Ÿπ‘£πœ†π‘£subscriptπœ‡π‘Ÿπ‘£πœ†subscriptπœ‡π‘Ÿπ‘£, quindi sostituendo nella formula precedente si ottiene

(Ξ»βˆ’ΞΌr)⁒(Aβˆ’ΞΌ1⁒I)⁒(Aβˆ’ΞΌ2⁒I)⁒⋯⁒(Aβˆ’ΞΌrβˆ’1⁒I)⁒v=0.πœ†subscriptπœ‡π‘Ÿπ΄subscriptπœ‡1𝐼𝐴subscriptπœ‡2𝐼⋯𝐴subscriptπœ‡π‘Ÿ1𝐼𝑣0

Ripetendo lo stesso ragionamento si ha (Aβˆ’ΞΌrβˆ’1⁒I)⁒v=(Ξ»βˆ’ΞΌrβˆ’1)⁒v𝐴subscriptπœ‡π‘Ÿ1πΌπ‘£πœ†subscriptπœ‡π‘Ÿ1𝑣 e sostituendo nella formula precedente si ottiene

(Ξ»βˆ’ΞΌr)⁒(Ξ»βˆ’ΞΌrβˆ’1)⁒(Aβˆ’ΞΌ1⁒I)⁒(Aβˆ’ΞΌ2⁒I)⁒⋯⁒(Aβˆ’ΞΌrβˆ’2⁒I)⁒v=0.πœ†subscriptπœ‡π‘Ÿπœ†subscriptπœ‡π‘Ÿ1𝐴subscriptπœ‡1𝐼𝐴subscriptπœ‡2𝐼⋯𝐴subscriptπœ‡π‘Ÿ2𝐼𝑣0

Continuando in questo modo, alla fine si ottiene

(Ξ»βˆ’ΞΌr)⁒(Ξ»βˆ’ΞΌrβˆ’1)⁒⋯⁒(Ξ»βˆ’ΞΌ2)⁒(Ξ»βˆ’ΞΌ1)⁒v=0.πœ†subscriptπœ‡π‘Ÿπœ†subscriptπœ‡π‘Ÿ1β‹―πœ†subscriptπœ‡2πœ†subscriptπœ‡1𝑣0

Dato che vβ‰ 0𝑣0, si deve annullare uno dei fattori (Ξ»βˆ’ΞΌi)πœ†subscriptπœ‡π‘–, quindi Ξ»πœ† deve essere uguale a uno dei ΞΌisubscriptπœ‡π‘–, il che significa che Ξ»πœ† Γ¨ uno zero del polinomio minimo mA⁒(x)subscriptπ‘šπ΄π‘₯.

Teorema di decomposizione. Sia f:Vβ†’V:𝑓→𝑉𝑉 una funzione lineare e sia F⁒(x)∈K⁒[x]𝐹π‘₯𝐾delimited-[]π‘₯ un polinomio tale che F⁒(f)=0𝐹𝑓0 (ad esempio, F𝐹 puΓ² essere il polinomio caratteristico pf⁒(x)subscript𝑝𝑓π‘₯ o il polinomio minimo mf⁒(x)subscriptπ‘šπ‘“π‘₯). Supponiamo che F𝐹 si fattorizzi nel prodotto F=F1β‹…F2⁒⋯⁒Fr𝐹⋅subscript𝐹1subscript𝐹2β‹―subscriptπΉπ‘Ÿ di polinomi Fi⁒(x)∈K⁒[x]subscript𝐹𝑖π‘₯𝐾delimited-[]π‘₯ non costanti e a due a due coprimi. Poniamo Vi=Ker⁒Fi⁒(f)subscript𝑉𝑖Kersubscript𝐹𝑖𝑓. Allora i sottospazi vettoriali Visubscript𝑉𝑖 sono in somma diretta tra loro e la loro somma Γ¨ uguale a tutto lo spazio vettoriale V𝑉

V=V1βŠ•V2βŠ•β‹―βŠ•Vr.𝑉direct-sumsubscript𝑉1subscript𝑉2β‹―subscriptπ‘‰π‘Ÿ

Inoltre i sottospazi Visubscript𝑉𝑖 sono stabili per la funzione f𝑓, cioΓ¨ f⁒(Vi)βŠ†Vi𝑓subscript𝑉𝑖subscript𝑉𝑖.

Dimostrazione. Dimostreremo questo risultato per induzione sul numero rπ‘Ÿ di fattori in cui si fattorizza il polinomio F⁒(x)𝐹π‘₯. Se r=1π‘Ÿ1 si ha F=F1𝐹subscript𝐹1 e dato che F⁒(f)=0𝐹𝑓0 si ha V1=Ker⁒F1⁒(f)=Vsubscript𝑉1Kersubscript𝐹1𝑓𝑉. Quindi in questo caso non c’è nulla da dimostrare.

Consideriamo ora il caso r=2π‘Ÿ2, cioΓ¨ F=F1β‹…F2𝐹⋅subscript𝐹1subscript𝐹2 con F1subscript𝐹1 e F2subscript𝐹2 coprimi. Da ciΓ² segue che esistono due polinomi G1,G2∈K⁒[x]subscript𝐺1subscript𝐺2𝐾delimited-[]π‘₯ tali che G1⁒(x)⁒F1⁒(x)+G2⁒(x)⁒F2⁒(x)=1subscript𝐺1π‘₯subscript𝐹1π‘₯subscript𝐺2π‘₯subscript𝐹2π‘₯1. Poniamo V1=Ker⁒F1⁒(f)subscript𝑉1Kersubscript𝐹1𝑓 e V2=Ker⁒F2⁒(f)subscript𝑉2Kersubscript𝐹2𝑓. Dobbiamo dimostrare che V1∩V2={0}subscript𝑉1subscript𝑉20, V1+V2=Vsubscript𝑉1subscript𝑉2𝑉, f⁒(V1)βŠ†V1𝑓subscript𝑉1subscript𝑉1 e f⁒(V2)βŠ†V2𝑓subscript𝑉2subscript𝑉2. Iniziamo col dimostrare che V1∩V2={0}subscript𝑉1subscript𝑉20.

Sia v∈V1∩V2𝑣subscript𝑉1subscript𝑉2. Dato che G1⁒(x)⁒F1⁒(x)+G2⁒(x)⁒F2⁒(x)=1subscript𝐺1π‘₯subscript𝐹1π‘₯subscript𝐺2π‘₯subscript𝐹2π‘₯1, si ha G1⁒(f)⁒F1⁒(f)+G2⁒(f)⁒F2⁒(f)=1subscript𝐺1𝑓subscript𝐹1𝑓subscript𝐺2𝑓subscript𝐹2𝑓1, quindi

(G1⁒(f)⁒F1⁒(f)+G2⁒(f)⁒F2⁒(f))⁒v=G1⁒(f)⁒F1⁒(f)⁒v+G2⁒(f)⁒F2⁒(f)⁒v=v.subscript𝐺1𝑓subscript𝐹1𝑓subscript𝐺2𝑓subscript𝐹2𝑓𝑣subscript𝐺1𝑓subscript𝐹1𝑓𝑣subscript𝐺2𝑓subscript𝐹2𝑓𝑣𝑣

Osserviamo che F1⁒(f)⁒v=0subscript𝐹1𝑓𝑣0 perchΓ© v∈V1=Ker⁒F1⁒(f)𝑣subscript𝑉1Kersubscript𝐹1𝑓 e F2⁒(f)⁒v=0subscript𝐹2𝑓𝑣0 perchΓ© v∈V2=Ker⁒F2⁒(f)𝑣subscript𝑉2Kersubscript𝐹2𝑓, quindi dalla formula precedente si ottiene 0=v0𝑣. Questo dimostra che V1∩V2={0}subscript𝑉1subscript𝑉20.

Ora dobbiamo dimostrare che V1+V2=Vsubscript𝑉1subscript𝑉2𝑉, cioΓ¨ che ogni vettore v∈V𝑣𝑉 si puΓ² scrivere come v=v1+v2𝑣subscript𝑣1subscript𝑣2, con v1∈V1subscript𝑣1subscript𝑉1 e v2∈V2subscript𝑣2subscript𝑉2. Abbiamo giΓ  visto che si ha

G1⁒(f)⁒F1⁒(f)⁒v+G2⁒(f)⁒F2⁒(f)⁒v=v,subscript𝐺1𝑓subscript𝐹1𝑓𝑣subscript𝐺2𝑓subscript𝐹2𝑓𝑣𝑣

quindi se poniamo v1=G2⁒(f)⁒F2⁒(f)⁒vsubscript𝑣1subscript𝐺2𝑓subscript𝐹2𝑓𝑣 e v2=G1⁒(f)⁒F1⁒(f)⁒vsubscript𝑣2subscript𝐺1𝑓subscript𝐹1𝑓𝑣 si ottiene v=v1+v2𝑣subscript𝑣1subscript𝑣2. Dobbiamo perΓ² dimostrare che v1∈V1subscript𝑣1subscript𝑉1 e v2∈V2subscript𝑣2subscript𝑉2.

Dato che V1=Ker⁒F1⁒(f)subscript𝑉1Kersubscript𝐹1𝑓, per dimostrare che v1∈V1subscript𝑣1subscript𝑉1 dobbiamo verificare che F1⁒(f)⁒v1=0subscript𝐹1𝑓subscript𝑣10. Si ha:

F1⁒(f)⁒v1subscript𝐹1𝑓subscript𝑣1 =F1⁒(f)⁒G2⁒(f)⁒F2⁒(f)⁒vabsentsubscript𝐹1𝑓subscript𝐺2𝑓subscript𝐹2𝑓𝑣
=F1⁒(f)⁒F2⁒(f)⁒G2⁒(f)⁒vabsentsubscript𝐹1𝑓subscript𝐹2𝑓subscript𝐺2𝑓𝑣
=F⁒(f)⁒G2⁒(f)⁒v=0absent𝐹𝑓subscript𝐺2𝑓𝑣0

ove abbiamo usato il fatto che G2⁒(f)⁒F2⁒(f)=F2⁒(f)⁒G2⁒(f)subscript𝐺2𝑓subscript𝐹2𝑓subscript𝐹2𝑓subscript𝐺2𝑓 perchΓ© i polinomi valutati in f𝑓 commutano tra loro, l’uguaglianza F1⁒(f)⁒F2⁒(f)=F⁒(f)subscript𝐹1𝑓subscript𝐹2𝑓𝐹𝑓 e l’ipotesi che F⁒(f)=0𝐹𝑓0.

In modo del tutto analogo si dimostra che anche v2∈V2subscript𝑣2subscript𝑉2. Rimane quindi solo da dimostrare che f⁒(V1)βŠ†V1𝑓subscript𝑉1subscript𝑉1 e f⁒(V2)βŠ†V2𝑓subscript𝑉2subscript𝑉2.

Sia v∈V1=Ker⁒F1⁒(f)𝑣subscript𝑉1Kersubscript𝐹1𝑓. Si ha

F1⁒(f)⁒f⁒(v)=f⁒(F1⁒(f)⁒(v))=f⁒(0)=0,subscript𝐹1𝑓𝑓𝑣𝑓subscript𝐹1𝑓𝑣𝑓00

quindi f⁒(v)∈V1𝑓𝑣subscript𝑉1. Questo dimostra che f⁒(V1)βŠ†V1𝑓subscript𝑉1subscript𝑉1 e, analogamente, si dimostra che f⁒(V2)βŠ†V2𝑓subscript𝑉2subscript𝑉2.

Questo conclude la dimostrazione nel caso r=2π‘Ÿ2. Consideriamo ora il caso r>2π‘Ÿ2. Per ipotesi induttiva supponiamo che il risultato valga in tutti i casi in cui il numero di fattori in cui si fattorizza il polinomio F⁒(x)𝐹π‘₯ sia ≀rβˆ’1absentπ‘Ÿ1. Sia F=F1β‹…F2⁒⋯⁒Frβˆ’1β‹…Fr𝐹⋅⋅subscript𝐹1subscript𝐹2β‹―subscriptπΉπ‘Ÿ1subscriptπΉπ‘Ÿ, ove i polinomi Fi⁒(x)∈K⁒[x]subscript𝐹𝑖π‘₯𝐾delimited-[]π‘₯ sono non costanti e a due a due coprimi. Se poniamo F~=F1β‹…F2⁒⋯⁒Frβˆ’1~𝐹⋅subscript𝐹1subscript𝐹2β‹―subscriptπΉπ‘Ÿ1 si ha F=F~β‹…Fr𝐹⋅~𝐹subscriptπΉπ‘Ÿ, ove F~~𝐹 e FrsubscriptπΉπ‘Ÿ sono coprimi. Ma questo Γ¨ precisamente il caso r=2π‘Ÿ2, in cui F𝐹 si fattorizza nel prodotto di due polinomi coprimi. Pertanto se poniamo V~=Ker⁒F~⁒(f)~𝑉Ker~𝐹𝑓 e Vr=Ker⁒F~r⁒(f)subscriptπ‘‰π‘ŸKersubscript~πΉπ‘Ÿπ‘“, si ha V=V~βŠ•Vr𝑉direct-sum~𝑉subscriptπ‘‰π‘Ÿ, f⁒(V~)βŠ†V~𝑓~𝑉~𝑉 e f⁒(Vr)βŠ†Vr𝑓subscriptπ‘‰π‘Ÿsubscriptπ‘‰π‘Ÿ.

Considerando poi F~=F1β‹…F2⁒⋯⁒Frβˆ’1~𝐹⋅subscript𝐹1subscript𝐹2β‹―subscriptπΉπ‘Ÿ1, siamo nel caso in cui il numero di fattori Γ¨ rβˆ’1π‘Ÿ1 e possiamo quindi usare l’ipotesi induttiva. Questo significa che V~=V1βŠ•V2βŠ•β‹―βŠ•Vrβˆ’1~𝑉direct-sumsubscript𝑉1subscript𝑉2β‹―subscriptπ‘‰π‘Ÿ1, ove Vi=Ker⁒Fi⁒(f)subscript𝑉𝑖Kersubscript𝐹𝑖𝑓 e f⁒(Vi)βŠ†Vi𝑓subscript𝑉𝑖subscript𝑉𝑖. Combinando questi due risultati si ottiene V=V1βŠ•V2βŠ•β‹―βŠ•Vr𝑉direct-sumsubscript𝑉1subscript𝑉2β‹―subscriptπ‘‰π‘Ÿ e la dimostrazione Γ¨ conclusa.

Usando il teorema di decomposizione siamo ora in grado di dimostrare un importante criterio di diagonalizzabilitΓ .

Teorema. Una matrice quadrata A𝐴 di ordine n𝑛 a elementi in un campo K𝐾 Γ¨ diagonalizzabile se e solo se tutti gli autovalori di A𝐴 esistono nel campo K𝐾 e il polinomio minimo di A𝐴 Γ¨ prodotto di fattori lineari distinti, cioΓ¨

mA⁒(x)=∏i=1r(xβˆ’Ξ»i),subscriptπ‘šπ΄π‘₯superscriptsubscriptproduct𝑖1π‘Ÿπ‘₯subscriptπœ†π‘–

con Ξ»i∈Ksubscriptπœ†π‘–πΎ tutti distinti.

Dimostrazione. Se A𝐴 Γ¨ diagonalizzabile esiste una matrice invertibile P𝑃 tale che Pβˆ’1⁒A⁒P=Dsuperscript𝑃1𝐴𝑃𝐷, ove D𝐷 Γ¨ una matrice diagonale con gli autovalori Ξ»isubscriptπœ†π‘– di A𝐴 lungo la diagonale principale. In questo caso si ha mA⁒(x)=mD⁒(x)subscriptπ‘šπ΄π‘₯subscriptπ‘šπ·π‘₯ e il polinomio minimo mD⁒(x)subscriptπ‘šπ·π‘₯ Γ¨ prodotto di fattori lineari distinti.

Viceversa, supponiamo che tutti gli autovalori di A𝐴 esistano in K𝐾 e che il polinomio minimo di A𝐴 sia prodotto di fattori lineari distinti,

mA⁒(x)=∏i=1r(xβˆ’Ξ»i),subscriptπ‘šπ΄π‘₯superscriptsubscriptproduct𝑖1π‘Ÿπ‘₯subscriptπœ†π‘–

con Ξ»i∈Ksubscriptπœ†π‘–πΎ tutti distinti. Dal teorema di decomposizione, prendendo F⁒(x)=mA⁒(x)𝐹π‘₯subscriptπ‘šπ΄π‘₯, si deduce che V=Kn𝑉superscript𝐾𝑛 si decompone nella somma diretta dei sottospazi Vi=Ker⁒(Aβˆ’Ξ»i⁒I)subscript𝑉𝑖Ker𝐴subscriptπœ†π‘–πΌ, cioΓ¨ nella somma diretta degli autospazi corrispondenti agli autovalori di A𝐴. Pertanto, unendo le basi di tutti gli autospazi di A𝐴 si ottiene una base di Knsuperscript𝐾𝑛 formata da autovettori di A𝐴, il che implica che A𝐴 Γ¨ diagonalizzabile.

Osservazione. In generale il polinomio caratteristico di una matrice A𝐴 non Γ¨ necessariamente prodotto di fattori lineari distinti, dato che gli autovalori di A𝐴 possono avere molteplicitΓ  algebrica maggiore di 11. Se Ξ»πœ† Γ¨ un autovalore con molteplicitΓ  algebrica m>1π‘š1, il sottospazio Ker⁒(Aβˆ’Ξ»β’I)mKersuperscriptπ΄πœ†πΌπ‘š Γ¨ detto autospazio generalizzato e i suoi vettori sono detti autovettori generalizzati.