vale che $M(n, \KK)=\Sym(n, \KK)\oplus\Lambda(n, \KK)$,
\item una base naturale di $\KK[x]$ è data da $\basis=\{x^n \mid
n \in\NN\}$, mentre una di $\KK_t[x]$ è data da $\basis\cap
\KK_t[x] = \{x^n \mid n \in\NN\land n \leq t\}$(quindi
$\dim\KK[x]=\infty$ e $\dim\KK_t[x]= t+1$),
\item una base naturale di $\KK$ è $1_\KK=\{1_\KK\}$ (quindi
$\dim\KK=1$),
\item un sottospazio di dimensione $1$ si definisce \textit{retta},
uno di dimensione $2$\textit{piano}, uno di dimensione $3$
\textit{spazio}, e, infine, uno di dimensione $n-1$ un iperpiano,
\item un iperpiano $\Pi$ è sempre rappresentabile da un'equazione cartesiana
nelle coordinate della rappresentazione della base (infatti ogni
iperpiano è il kernel di un funzionale $f \in\dual{V}$, e $M^\basis_{1_\KK}(f)\,[\vec{v}]_\basis=0$ è l'equazione cartesiana; è sufficiente prendere una base di $\Pi$ e completarla
a base di $V$ con un vettore $\vec{t}$, considerando infine
\item un iperpiano $\Pi$, rappresentato da un'equazione cartesiana $\alpha_1 x_1+\ldots+\alpha_n x_n =0$, è esattamente il sottospazio ortogonale a $\Span(\alpha_1, \ldots, \alpha_n)^\perp$ tramite il prodotto scalare standard,
\item in generale, un sistema di equazioni omogenee è l'intersezione di più
\item se $\mathbb{F}$ è un'estensione di campo di $\KK$, allora vale $[V : \KK]=[V : \mathbb{F}][\mathbb{F} : \KK]$ (\textit{teorema delle torri algebriche}).
\item$M^{\basis_V}_{\basis_W}(f)=\begin{pmatrix}\;[f(\vec{v_1})]_{\basis_W}\,\mid\,\cdots\,\mid\,[f(\vec{v_n})]_{\basis_W}\;\end{pmatrix}$ è la matrice
associata a $f$ sulle basi $\basis_V$, $\basis_W$,
\item$M^V_W(f + h)= M^V_W(f)+ M^V_W(h)$,
\item$M^V_Z(g \circ f)= M^W_Z(g) M^V_W(f)$,
\item data $A \in M(m, n, \KK)$, sia $f_A : \KK^n \to\KK^m$ tale
che $f_A(\vec{x})= A \vec{x}$, allora $M^{e}_{e'}(f_A)= A$,
\item$f$ è completamente determinata dai suoi valori in una
qualsiasi base di $V$ ($M^{\basis_V}_{\basis_W}$ è un isomorfismo
tra $\mathcal{L}(V, W)$ e $M(\dim W, \dim V, \mathbb{K})$),
\item$\dim\mathcal{L}(V, W)=\dim V \cdot\dim W$ (dall'isomorfismo
Si dice che i sottospazi $W_1$, ..., $W_k$ di $V$ sono in somma
diretta, e si scrive $W_1+\ldots+ W_k = W_1\oplus\ldots\oplus W_k$,
se la rappresentazione di un vettore della somma di questi sottospazi
è unica, ossia se esistono unici $\ww1\in W_1$, ..., $\ww k \in W_k$ tali
per cui $\w\in W_1+\ldots+ W_k$ si scrive come $\w=\ww1+\ldots+\ww k$. \\
In generale, sono equivalenti i seguenti fatti:
\begin{enumerate}[(i)]
\itemsep0em
\item$W_1$, ..., $W_k$ sono in somma diretta,
\item Se esistono $\ww1\in W_1$, ..., $\ww k \in W_k$ tali per cui
$\ww1+\ldots+\ww k =\vec0$, allora $\ww1=\cdots=\ww k =\vec0$ (è sufficiente considerare due scritture alternative e poi farne la differenza per dimostrare un'implicazione),
\item Se $\basis_{W_1}$, ..., $\basis_{W_k}$ sono basi di $W_1$, ..., $W_k$,
allora $\bigcup_{i=1}^k \basis_{W_i}$ è base di $W_1+\ldots+ W_k$ (è sufficiente considerare l'indipendenza lineare per dimostrare un'implicazione),
\item$\dim(W_1+\ldots+ W_k)=\dim W_1+\ldots+\dim W_k$ (si dimostra facilmente che è equivalente a (iii), e quindi che lo è alle altre proposizioni),
\item$W_i \cap(W_1+\ldots+ W_{i-1})=\zerovecset$$\forall2\leq i \leq k$ (è sufficiente spezzare la somma in $(W_1+\ldots+ W_{i-1})+ W_i$ e ricondursi al caso di due sottospazi, mostrando in particolare, per induzione, l'equivalenza con (iv), da cui seguono le altre equivalenze),
\item$W_i \cap(W_1+\ldots+ W_{i-1}+\widehat{W_i}+ W_{i+1}+ W_k)=\zerovecset$$\forall1\leq i \leq k$, ossia $W_i$, intersecato con la somma
dei restanti sottospazi, è di dimensione nulla (è facile ricondursi alla proposizione (v) per induzione).
Se $A \in M(m, n, \RR)$, allora $\Ker A^\top A =\Ker A$. Infatti, se $\vec x \in\Ker A^\top A$, allora $A^\top A \vec x =\vec0\implies\vec x ^\top A^\top A \vec x =\vec0\implies q(A \vec x)=\vec0\implies A \vec x =\vec0\implies\vec x \in\Ker A$, dove $q$ è la forma quadratica derivante dal prodotto scalare standard
di $\RR^n$. Da questo risultato si deduce anche che $\rg(A^\top A)=\rg(A)$. \\
\vskip 0.05in
Se $A \in M(m, n, \CC)$, allora $\Ker A^* A =\Ker A$ e $\rg(A^* A)=\rg(A)$ (si segue la stessa linea
\item$\rg(A)=1\implies\exists B \in M(m, 1, \KK)$, $C \in M(1, n, \KK)\mid A=BC$ (infatti $A$ può scriversi come $\begin{pmatrix}\alpha_1 A^i &\cdots&\alpha_n A^i \end{pmatrix}$ per un certo $i \leq n$ tale che $A^i \neq\vec{0}$).
In particolare, l'operazione di scambio della riga $i$-esima con quella $j$-esima corrisponde alla moltiplicazione a sinistra per la matrice $S_{i,j}$, detta matrice
In particolare, la stessa matrice $S_{i,j}$ si ottiene scambiando la riga $i$-esima e la $j$-esima. Per esempio, scambiare due righe in una matrice $2\times2$ corrisponde a
All'operazione di moltiplicazione della riga $i$-esima per uno scalare $\lambda\neq0$ corrisponde invece la matrice $M_{i, \lambda}$, detta elementare di dilatazione, dove:
All'operazione di somma della riga $j$-esima moltiplicata per $\lambda\neq0$ alla riga $i$-esima corrisponde invece la matrice $M_{i,j,\lambda}$, detta elementare di trasvezione (o di tosatura, dall'inglese \textit{shear matrix}), dove:
\item le matrici elementari generano il gruppo delle matrici invertibili $\GL(n, \KK)$, ossia ogni matrice
invertibile si scrive come prodotto di matrici elementari (è sufficiente
applicare l'algoritmo di eliminazione di Gauss per righe su $A \in\GL(n, \KK)$ e
osservare che ne deve risultare obbligatoriamente una matrice diagonale che,
normalizzata sugli elementi, restituisce esattamente $I_n$; allora poiché applicare l'algoritmo
equivale a moltiplicare a sinistra per delle matrici elementari $\mathcal{E}_1$, ..., $\mathcal{E}_k$, si verifica che $\mathcal{E}_1\cdots\mathcal{E}_k A = I_n \implies A =\mathcal{E}_k \inv\cdots\mathcal{E}_1\inv$, dove si
conclude la dimostrazione osservando che l'inversa di una matrice elementare
Queste operazioni non variano né $\Ker A$ né $\rg(A)$. Permettendo di variare $\Ker A$ si possono effettuare le stesse medesime operazioni
sulle colonne (lasciando però
invariato $\Im A$, e quindi $\rg(A)$): tali operazioni corrispondono a moltiplicare a destra per una matrice invertibile, analogamente a come accade per le righe. \\
Le matrici per cui si moltiplica a destra per operare sulle colonne sono esattamente le stesse matrici impiegate
per le operazioni di riga, sebbene trasposte (e quindi sono ancora matrici elementari). In particolare le matrici elementari di permutazione (per scambiare le righe) e di dilatazione (per moltiplicare una riga per uno scalare non nullo) coincidono. Pertanto, se $A$ è una matrice simmetrica (i.e.~se $A \in\Sym(n, \KK)$), operare mediante le stesse
Si definisce matrice di Vandermonde una matrice $A \in M(n, \KK)$ della
forma:
\[ A =\begin{pmatrix}
1 & x_1 & x_1^2 &\dots& x_1^{n-1}\\
1 & x_2 & x_2^2 &\dots& x_2^{n-1}\\
\vdots&\vdots&\vdots&\ddots&\vdots\\
1 & x_n & x_n^2 &\dots& x_n^{n-1}.
\end{pmatrix}\]
Vale allora che:
\[\det(A)=\prod_{1\leq i < j \leq n}(x_j - x_i), \]
verificabile notando che $\det(A)$ è di grado $\frac{n(n-1)}{2}$ e
che ponendo $x_i = x_j$ per una coppia $(i, j)$, tale matrice
ha due righe uguali, e quindi determinante nullo $\implies(x_j - x_i)\mid\det(A)\overbrace{\implies}^{\text{UFD}}\det(A)=\prod_{1\leq i < j \leq n}(x_j - x_i)$.
Pertanto una matrice di Vandermonde è invertibile se e solo se la sua
seconda colonna contiene tutti scalari distinti nelle coordinate. Tale
matrice risulta utile nello studio dell'interpolazione di Lagrange
(ossia nella dimostrazione dell'unicità del polinomio di $n-1$ grado
tale che $p(\alpha_i)=\beta_i$ per $i$ coppie ($\alpha_i$, $\beta_i$) con
\subsubsection{Rango tramite il determinante degli orlati}
Si dicono \textit{sottomatrici} della matrice $A \in M(m, n, \KK)$ tutte
le matrici contenute in $A$, ossia le matrici $B$ che sono ottenibili da $A$
mantenendo solo alcune sue righe e colonne. In generale, si scrive $A^{j_1, \ldots, j_s}_{i_1, \ldots, i_t}$ per indicare la sottomatrice ottenuta
da $A$ mantenendo le colonne di indice $j_1$, ..., $j_s$ e le righe di
indice $i_1$, ..., $i_t$. Quando è omesso l'indice delle colonne o l'indice
delle righe, si sottintende di aver mantenuto o tutte le colonne o tutte le righe
(e.g.~$A_{1,2}$ è la sottomatrice di $A$ ottenuta mantenendo tutte le colonne e
le prime due righe). Si dice che $M$ è \textit{minore} di $A$ una sua sottomatrice quadrata. Si chiamano \textit{orlati} di un minore $M$ di taglia $k$ i minori di taglia $k+1$ di $A$ aventi $M$ come minore.
di $B$ e mostrare che le relative colonne in $A$ sono ancora linearmente indipendenti),
\item$\rg(A)=\max\{\rg(B)\mid B \text{ sottomatrice di }\! A\}$ (è sufficiente utilizzare il precedente risultato; infatti $A$ è una sottomatrice di $A$),
\item$\rg(A)=\max\{\rg(B)\mid B \text{ minore invertibile di }\! A\}=\max\{n \mid\text{esiste un minore di $A$ di taglia $n$ invertibile}\}$ (è sufficiente utilizzare la prima disuguaglianza e considerare un minore di $A$ composto dalle righe e le colonne linearmente indipendenti di $A$, che sono
dello stesso numero, dal momento che il rango per righe è uguale al rango per colonne),
\item$\rg(A)$ è il più piccolo naturale $n$ tale per cui, per ogni minore
$M$ di $A$ di taglia maggiore di $n$, $\det(M)=0$ (ossia $M$ è singolare; segue direttamente dal precedente risultato),
\item$\rg(A)$ è il più piccolo naturale $n$ tale per cui, per ogni minore
$M$ di $A$ di taglia $n+1$, $\det(M)=0$ (ossia $M$ è singolare; segue dal precedente risultato a cui si combina lo sviluppo di Laplace del determinante -- se ogni minore di taglia $k$ ha determinante nullo, anche tutti i minori di
taglia maggiore di $k$ hanno determinante nullo).
\item esiste un minore $M$ di taglia $k$ di $A$ con $\det(M)\neq0$$\implies\rg(A)\geq k$ (deriva direttamente dall'ultimo risultato sul rango),
\item per ogni minore $M$ di taglia $k$ di $A$ vale che $\det(M)=0$
$\implies\rg(A) < k$ (come sopra).
\end{itemize}
Si può facilitare lo studio del rango tramite il teorema di Kronecker (o degli orlati): $\rg(A)$ è il più piccolo naturale $n$ tale per cui esista un minore
$M$ di taglia $k$ con $\det(M)\neq0$ e per cui ogni suo orlato $O$ è tale
per cui $\det(O)=0$.
Sia infatti, senza perdità di generalità, $M = A^{1,\ldots, k}_{1,\ldots,k}$ tale minore (altrimenti è sufficiente considerare una permutazione delle righe e
delle colonne per ricadere in questo caso; tale permutazione è ammessa dall'algoritmo di Gauss). Si mostra che $A^j \in\Span(A^1, \ldots, A^k)$$\forall j > k$. Si consideri ogni orlato $M_j$ di $M$ ottenuto scegliendo
la $j$-esima colonna di $A$: per ipotesi $\det(M_j)=0$, ed il rango è almeno
$k$. Quindi $\rg(M_j)= k$; poiché le prime $k$ righe sono linearmente indipendenti, l'ultima riga aggiunta deve certamente appartenere al loro
sottospazio generato. Quindi ogni riga di $A^{1,\ldots, k, j}$ appartiene
al sottospazio $\Span(A_1, \ldots, A_k)$, da cui si deduce che $\rg(A^{1,\ldots, k, j})= k$, e quindi che $\rg(A^{1,\ldots,k,j})= k \implies A^j \in\Span(A^1, \ldots, A^k)\implies\rg(A)= k$.
\item il termine noto di $p_f(\lambda)$ è $\det(f -0\cdot\Idv)=\det(f)$,
\item$p_f(\lambda)=\sum_{i=0}^{n}(-\lambda)^i(\sum\det(M_{n-i}))$ dove i $M_j$ sono i minori principali di taglia $j$, % TODO: sistemare e aggiungere spiegazione
Se $f$ è diagonalizzabile, anche $f^k$ lo è, per ogni $k \in\NN$. Se
ogni vettore di $V$ è un autovettore di $f$, allora $f =\lambda\Id$,
con $\lambda\in\KK$ (è sufficiente considerare l'eventuale esistenza di più
autospazi e due vettori $\v$ e $\w$ di due autospazi distinti e considerare
le due scritture possibili di $f(\v+\w)$).
Si dice infine che $f$ è triangolabile (o triangolarizzabile) se $V$
ammette una base per cui la matrice associata di $f$ è triangolare superiore
(o inferiore, dal momento che è sufficiente riordinare dal basso la base
per ottenere una matrice associata triangolare superiore). Vale in particolare
che $f$ è triangolabile se e soltanto se $p_f(\lambda)$ è completamente
riducibile in fattori lineari in $\KK$ (dunque, nel caso di $\KK$ algebricamente
chiuso, $f$ è sempre triangolabile). Infatti, se $f$ è triangolabile, il polinomio
caratteristico ha come radici esattamente gli elementi sulla diagonale della
matrice associata di $f$ nella base $\basis$ in cui tale matrice è triangolare
superiore (e dunque $p_f(\lambda)$ è riducibile in fattori lineari). Se invece $p_f(\lambda)$ è riducibile in fattori lineari, si può applicare il seguente
algoritmo (su cui si fonda induttivamente la dimostrazione della proposizione):
\begin{enumerate}
\itemsep 0pt
\item Si calcolino le basi degli autospazi di $f$,
\item Si estenda l'unione $\basis_A$ di queste basi a una base $\basis$ di $V$,
\item Si consideri la matrice associata di $f$ nella base $\basis$, della forma: \setlength{\extrarowheight}{1.3pt}
\[M_\basis(f)=\begin{pmatrix}
A
&\rvline& B \\
\hline
0 &\rvline&
C
\end{pmatrix}, \]\setlength{\extrarowheight}{0pt}dove $A$ è una matrice diagonale contenente gli autovalori di $\Sp(f)$,
\item Se $M_\basis(f)$ è triangolare superiore, l'algoritmo termina. Altrimenti si ripeta l'algoritmo su $C$ (ossia sull'endomorfismo $p_W \circ\restr{f}{W}\in\End(W)$, dove $W$ è il sottospazio generato dai vettori aggiunti alla base $\basis_A$ per costruire la base $\basis$).
\end{enumerate}
Inoltre, se $W$ è un sottospazio $f$-invariante di $V$,
e $f$ è triangolabile, anche $\restr{f}{W}$ lo è (infatti,
in tal caso, il polinomio caratteristico di $f$ si riduce
simultaneamente triangolabili se esiste una base $\basis$
in cui $M_\basis(f)$ e $M_\basis(g)$ sono due matrici
triangolari superiori. Non è generalmente vero che
due endomorfismi simultaneamente triangolabili
commutano; è tuttavia vero il viceversa. Se infatti $f$
e $g$ sono due endomorfismi triangolabili tali che $f \circ g = g \circ f$, allora si può riapplicare, con le dovute modifiche, il precedente algoritmo di triangolarizzazione (anche questa volta dimostrabile per induzione):
\begin{enumerate}
\itemsep 0pt
\item Si calcolino le basi degli autospazi di $f$ e si consideri $\restr{f}{U}$, dove $U =\eigsp1\oplus\cdots\oplus\eigsp k$,
\item Si cerchi una base $\basis_U$ in cui $\restr{f}{U}$ e $\restr{g}{U}$ sono simultaneamente diagonalizzabili (osservando che $g$ è $U$-invariante),
\item Si estenda tale base $\basis_U$ ad una base $\basis$ di $V$ e si chiami $W$ il sottospazio $\Span(\basis_W)$, dove $\basis_W :=\basis\setminus\basis_U$,
\item Si considerino la matrice associata di $f$ e di $g$ nella base $\basis$, della forma: \setlength{\extrarowheight}{1.3pt}
\begin{gather*}
M_\basis(f) = \begin{pmatrix}
A
&\rvline& B \\
\hline
0 &\rvline&
C
\end{pmatrix}, \\
M_\basis(g) = \begin{pmatrix}
A'
&\rvline& B' \\
\hline
0 &\rvline&
C'
\end{pmatrix},
\end{gather*}
\setlength{\extrarowheight}{0pt}dove $A$ e $A'$ sono matrici diagonali contenente gli autovalori dei rispettivi endomorfismi,
\item Se le due matrici sono triangolari superiori, l'algoritmo termina. Altrimenti si ripeta l'algoritmo su $C$ e $C'$ (ossia sugli endomorfismi $p_W \circ\restr{f}{W}$, $p_W \circ\restr{g}{W}\in\End(W)$, i
quali commutano, dal momento che vale l'identità $C C' = C' C$, dedotta moltiplicando le due matrici associate di sopra).
\end{enumerate}
\subsubsection{Polinomio minimo}
Sia $f \in\End(V)$. Si può allora definire l'applicazione $\sigma_f : \KK[x]\to\End(V)$
tale per cui $\sigma_f(p)= p(f)$, dove per $p(f)$ s'intende
la riscrittura di $p$ a cui si sostituisce all'usuale
somma e all'usuale prodotto, la somma di applicazioni
e la composizione (intendendo, in particolare, i termini
noti come multipli dell'identità $f^0 :=\Idv$). In particolare $\sigma_f$ è un omomorfismo di anelli,
ed è dunque anche un'applicazione lineare. $\sigma_f$ non
è mai iniettiva, ed esiste dunque sempre un polinomio $p$
tale per cui $\sigma_f(p)=0$, l'applicazione nulla (è
sufficiente prendere $n^2+1$ potenze di $f$ e osservare
\item gli autovalori hanno moltiplicità algebrica $1$ in $\varphi_f$ se e solo se $f$ è diagonalizzabile (è sufficiente utilizzare il precedente risultato, o considerare la forma canonica di Jordan),
\item se $f$ è nilpotente, $\varphi_f(t)= t^k$, dove $k$ è l'indice di Fitting
di $\Ker f$ (discende direttamente dalla forma di $p_f$ se $f$ è nilpotente),
\item se $p \in\KK[x]$ è tale per cui $p = p_1\cdots p_k$ con $p_1$, ..., $p_k \in\KK[x]$ coprimi, allora $\Ker p(f)=\Ker p_1(f)\oplus\cdots\oplus\Ker p_k(f)$ (teorema di decomposizione primaria; si dimostra facilmente attraverso il teorema di Bezout),
\item$V =\gensp1\oplus\cdots\oplus\gensp k$, se $\lambda_1$, ..., $\lambda_k$ sono tutti gli autovalori di $f$ (deriva direttamente dal teorema
di Hamilton-Cayley e dal teorema di decomposizione primaria, o, alternativamente,
Se $\KK$ è infinito, $V$ ammette una base ciclica se e solo se $p_f =\pm\varphi_f$ (infatti esiste sempre un vettore $\v$ tale per cui $\varphi_f =\varphi_{f, \v}$). In
Si definisce blocco di Jordan di taglia $k$ relativo
all'autovalore $\lambda$ la seguente matrice:
\[J_{\lambda, k} :=\begin{pmatrix}
\lambda&1&0&\cdots&0 \\
0&\ddots&\ddots&&\vdots\\
\vdots&\ddots&\ddots&\ddots&0\\
\vdots&&\ddots&\ddots&1 \\
0&\cdots&\cdots&0&\lambda
\end{pmatrix},\]
ossia la matrice che ha solo $\lambda$ sulla diagonale, $1$ sulla
sopradiagonale e $0$ nelle altre posizioni. Si può
sempre restringere un blocco di Jordan a un blocco nilpotente
considerando $J = J_{\lambda, k}-\lambda I_k$. Tale blocco
ha come polinomio minimo $\varphi_J(t)= t^k$, e dunque
$\varphi_{J_{\lambda, k}}(t)=(t-\lambda)^k$. Allo stesso
modo si calcola $p_{J_{\lambda, k}}(t)=(t-\lambda)^k$. Si osserva dunque
che $\mu_{a, J_{\lambda, k}}(\lambda)=\mu_{a, J}(0)$.
Poiché il polinomio caratteristico ed il polinomio minimo coincidono a meno
del segno, esiste sempre una base ciclica per la quale $J_{\lambda, k}$
si scrive come matrice compagna di $\varphi_{J_{\lambda, k}}$.
Si definisce forma canonica di Jordan di un endomorfismo $f$
una sua matrice associata in una base $\basis$ tale per cui:
\[M_\basis(f)=\begin{pmatrix}
J_1 && 0 \\
&\ddots&\\
0 && J_s \end{pmatrix}, \]
dove $J_1$, ..., $J_s$ sono blocchi di Jordan. La forma canonica
di Jordan esiste sempre ed è unica a meno di permutazione dei blocchi,
se tutti gli autovalori di $f$ sono in $\KK$ (teorema di Jordan; se
gli autovalori di $f$ non sono tutti in $\KK$, si può sempre considerare
un'estensione di campo in cui esistono).
Si definisce autospazio generalizzato relativo all'autovalore $\lambda$ di
$f \in\End(V)$ lo spazio:
\[\Gensp=\Ker(f -\lambda\Idv)^n. \]
Una definizione alternativa, ma equivalente di $\Gensp$ è la seguente:
\[\Gensp=\{\v\in V \mid\exists k \in\NN\mid(f-\lambda\Idv)^k =\vec0\}, \]
ossia $\Gensp$ è lo spazio dei vettori $\v\in V$ tali per cui, applicando ripetutamente $f-\lambda\Idv$, si ottiene un autovettore relativo a $\lambda$ (per
dimostrare l'equivalenza delle due dimostrazioni è sufficiente considerare la
decomposizione di Fitting). In generale, dalla catena della decomposizione
dove $k$ è la molteplicità algebrica di $\lambda$ in $\varphi_f$ (in particolare
si ottiene sempre l'autospazio generalizzato sostituendo $\mu_a(\lambda)$ a $q$,
dacché $\mu_a(\lambda)\geq k$).
In generale vale che:
\[ V =\gensp1\oplus\cdots\oplus\gensp k, \]
se $\lambda_1$, ..., $\lambda_k$ sono tutti gli autovalori di $f$ (vd.~polinomio minimo). Inoltre, $\restr{f}{\Gensp}$ ammette come autovalore soltanto $\lambda$
(pertanto $\dim\Gensp=\mu_{a, f}(\lambda)$, confrontando i polinomi caratteristici). Si osserva inoltre che $\Gensp$ è sempre $f$-invariante. Infatti ogni $f$ induce due catene di inclusione:
&\Ker B = B^{k-1}(U_1) \oplus B^{k-2}(U_2) \oplus\cdots\oplus U_k;
\end{flalign*}
\item Si scelgano da queste basi i vettori che generano ogni blocco
relativo a $\lambda$ (in particolare ogni vettore di base di $U_i$ genera
un blocco di taglia $k-1+i$),
\item Per ogni blocco, generato dal vettore $\v$, si costruisca una base ordinata nel seguente modo:
\[\basis' =\{B^{t-1}\v ,\ldots , B \v, \v\}, \]
dove $t$ è l'indice minimo per cui $B^t \v=0$;
\end{enumerate}
\item Si uniscano ordinatamente a catena le basi ottenute in una base $\basis_J$. La base $[]_\basis\inv\basis_J$ è allora base di Jordan. In particolare, se
$P =\Matrix{\v_1\cdots\v_n}$, dove $\basis_J=\{\v_1, \ldots, \v_n\}$, vale
che $J = P\inv A P$ è esattamente la forma canonica di Jordan individuata
da tale base.
\end{enumerate}
Se $f$ è nilpotente, l'algoritmo può essere velocizzato notevolmente considerando
solamente $B := A$. Se $f$ ha un solo autovalore $\lambda$ e ammette una base ciclica (ossia esiste un solo blocco di Jordan), considerando $B := A -\lambda I_n$,
quasi ogni vettore è un vettore ciclico (è pertanto consigliato cercare un vettore
in modo casuale, piuttosto che estendere tutte le basi dei kernel).
\subsubsection{La forma canonica di Jordan reale}
Sia $A \in M(n, \RR)$. Allora
la forma canonica di Jordan reale è una variante reale della forma canonica di
Jordan che esiste sempre (infatti gli autovalori di $A$ non sono forzatamente
in $\RR$, e potrebbero dunque essere in $\CC\setminus\RR$). La forma canonica di
Jordan reale si costruisce a partire da una forma canonica di Jordan $J$
e una sua base di Jordan $\basis$ associata. Tale forma canonica
si costruisce mediante il seguente algoritmo:
\begin{enumerate}
\item Si scelga un autovalore $z$, se non si è già considerato il
suo coniugato $\conj z$:
\begin{enumerate}[a.]
\item Si prenda la base $\basis_z =\{\vv1, \ldots, \vv k, \conj{\vv1}, \ldots, \conj{\vv k}\}$ che
genera i blocchi di $z$ e $\conj z$ e si consideri la nuova
\item In tale base la forma canonica di Jordan varia eliminando i blocchi
di $\conj z$, sostituendo all'autovalore $z = a + bi$ il seguente blocco:
\[\Matrix{
a & -b \\ b & a
}, \]
ed ingrandendo gli eventuali $1$ mediante l'identità $I_2$ (tale processo prende
il nome di complessificazione).
\end{enumerate}
\item La matrice ottenuta dopo aver considerato tutti gli eventuali autovalori complessi è una forma canonica di Jordan reale, e la base ottenuta mediante
tutti i processi di complessificazione è una base di Jordan reale.
Si consideri una mappa $\varphi : V \times V \to\KK$. Si dice che
$\varphi$ è un prodotto scalare (e quindi che $\varphi\in\PS(V)$, lo spazio dei prodotti scalari) se è una forma bilineare simmetrica.
In particolare vale la seguente identità:
\[\varphi\left(\sum_{i=1}^s a_i \vv i, \sum_{j=1}^t b_j \ww j \right)=
\sum_{i=1}^s \sum_{j=1}^t a_i b_j \varphi(\vv i, \ww j). \]
Se $\basis=\{\vv1, \ldots ,\vv n \}$ è una base di $V$, si definisce $M_\basis(\varphi)=(\varphi(\vv i, \vv j))_{i,j=1\mbox{--}n}$ come la matrice associata al prodotto scalare $\varphi$. In particolare,
se $a_\varphi : V \to V^*$ è la mappa lineare che associa a $\v$ il funzionale $\varphi(\v, \cdot)\in V^*$
Si definisce prodotto scalare \textit{standard} il prodotto $\varphi$ tale che
$\varphi(\v, \w)=[\v]_\basis^\top[\w]_\basis$.
Si dice che due vettori $\v$, $\w\in V$ sono ortogonali tra loro, scritto come $\v\perp\w$, se
$\varphi(\v, \w)=0$. Dato $W$ sottospazio di $V$, si definisce $W^\perp$ come il sottospazio di $V$ dei vettori ortogonali a tutti i vettori di $W$. Si dice che $\varphi$ è non degenere se $V^\perp=\zerovecset$.
Si scrive in particolare che $V^\perp=\Rad(\varphi)$.
Si dice che $V = U \oplus^\perp W$ (ossia che $U$ e $W$ sono in somma diretta ortogonale) se $V = U \oplus W$ e $U \subseteq W^\perp$. Sia $i : W \to V$ tale che $\w\mapsto\w$. Si scrive $\restr{\varphi}{W}$ intendendo $\restr{\varphi}{W \times W}$.
Ad ogni prodotto scalare si può associare una forma quadratica (e viceversa) $q : V \to\KK$ tale che
$q(\v)=\varphi(\v, \v)$. Un vettore $\v\in V$ si dice isotropo se $q(\v)=0$ (altrimenti si dice
anisotropo). Si definisce il cono isotropo $\CI(\varphi)$ come l'insieme dei vettori isotropi di $V$.
Se $\KK=\RR$, si dice che $\varphi$ è semidefinito positivo ($\varphi\geq0$) se $q(\v)\geq0$$\forall\v\in V$, e che è semidefinito negativo ($\varphi\leq0$) se $q(\v)\leq0$$\forall\v\in V$. Si dice
che $\varphi$ è definito positivo ($\varphi > 0$) se $\varphi\geq0$ e se $q(\v)=0\iff\v=\vec0$,
e che è definito negativo ($\varphi < 0$) se $\varphi\leq0$ e se $q(\v)=0\iff\v=\vec0$.
Si dice che $\varphi$ è definito se è definito positivo o definito negativo. Analogamente $\varphi$
è semidefinito se è semidefinito positivo o semidefinito negativo.
Se $U$ è un sottospazio di $V$, $\varphi$ induce un prodotto scalare $\hat\varphi : V/U \times V/U \to\KK$ tale che $\hat\varphi([\vv1]_U, [\vv2]_U)=\varphi(\vv1, \vv2)$ se e solo se $U \subseteq V^\perp$. In particolare, se $U = V^\perp$,
l'esistenza di un vettore anisotropo $\w\in V$ ed osservare che $V = W \oplus^\perp W^\perp$, dove $W =\Span(\w)$, concludendo per induzione; o in caso di non esistenza di tale $\w$, concludere per il
Inoltre $\sigma$ è un invariante completo per la congruenza, e vale che, su una qualsiasi base ortogonale $\basis'$ di $V$, $\iota_+$ è esattamente il numero
di vettori anisotropi di base con forma quadratica positiva, che $\iota_-$ è il numero di vettori con forma
negativa e che $\iota_0$ è il numero di vettori isotropi (teorema di Sylvester, caso reale; si consideri
una base ortogonale e se ne normalizzino i vettori anisotropi, facendo infine eventuali considerazioni
dimensionali per dimostrare la seconda parte dell'enunciato),
Sia $V$ un $\CC$-spazio. Allora una mappa $\varphi : V \times V \to\CC$ si
dice prodotto hermitiano (e quindi si dice che $\varphi\in\PH(V)$, l'$\RR$-spazio dei
prodotti hermitiani\footnote{Infatti, se $\lambda\in\CC\setminus\RR$ e $\varphi\in\PH(V)$, $\lambda\varphi$\underline{non} è un prodotto hermitiano, mancando della proprietà del coniugio.}) se è una forma sesquilineare, ossia se è antilineare
nel primo argomento ed è lineare nel secondo\footnote{In realtà questa convenzione è spesso e volentieri implementata nelle ricerche di Fisica, mentre in Matematica si tende in realtà a mettere l'antilinearità nel secondo argomento. Il corso ha comunque implementato la prima delle due convenzioni, e così si è riportato in queste schede la convenzione scelta.}, e se il coniugio applicato a $\varphi$ ne inverte gli argomenti. In particolare $\varphi$ è un prodotto hermitiano se:
scalare su $\RR$ (le definizioni principali sono infatti le medesime). Se $\basis$ è una base di $V$, la matrice associata $M_\basis(\varphi)$ è definita in
modo tale che $M_\basis(\varphi)_{ij}=\varphi(\vv i, \vv j)$. Infatti tale prodotto soddisfa le seguenti proprietà:
Esiste un unico modo per complessificare un prodotto scalare $\varphi$, ossia
esiste un unico prodotto hermitiano $\varphi_\CC$ tale per cui $\varphi_\CC(\v, \w)=\varphi(\v, \w)$ se $\v$, $\w$ sono vettori della parte reale dello spazio complessificato. In particolare $\varphi_\CC$ è determinato dalla seguente
Dal momento che $\Im(\alpha_\varphi)=\Ann(V^\perp)$ (l'inclusione verso destra è facile da dimostrare e l'uguaglianza è data dall'uguaglianza dimensione), $f$ è rappresentabile
segue che $(\Ker f)^\perp=\v^\dperp=\Span(\v)+ V^\perp$. Se $f$ non è
l'applicazione nulla, $\vec v \notin V^\perp$, e quindi $\Span(\v)\cap V^\perp=\zerovecset\implies(\Ker f)^\perp=\Span(\v)\oplus^\perp V^\perp$. Quindi,
per computare un vettore $\vv0$ che rappresenti $f$ è sufficiente prendere
un supplementare $\Span(\U)$ di $V^\perp$ in $(\Ker f)^\perp$ (infatti l'aggiunta
di un vettore di $V^\perp$ non varierebbe l'immagine secondo $\alpha_\varphi$) e
computare $\lambda\in\KK\mid\vv0=\lambda\U$ nel seguente
\subsubsection{Metodo di Jacobi per il calcolo della segnatura}
Sia $A = M_\basis(\varphi)$ una matrice associata a $\varphi$ nella base $\basis$.
Sia $d_0 :=1$. Se $d_i =\det(A_{1, \ldots, i}^{1, \ldots, i})$ (è possibile anche
prendere un'altra sequenza di minori, a patto che essi siano principali e che siano
crescenti per inclusione) è diverso da zero
per ogni $1\leq i \leq n-1$, allora $\iota_+$ è il numero di permanenze di segno
di $d_i$ (zero escluso), $\iota_-$ è il numero di variazioni di segno (zero escluso), e $\iota_0$ è $1$ se
$d_n =0$ o $0$ altrimenti.
In generale, se $W$ è un sottospazio di $W'$, $W$ ha codimensione $1$ rispetto a $W'$ e $\det(M_{\basis_W}(\restr{\varphi}{W}))\neq0$ per una base $\basis_W$ di $W$, allora la segnatura
di $\restr{\varphi}{W'}$ è la stessa di $\restr{\varphi}{W}$, dove si aggiunge
$1$ a $\iota_+$, se i determinanti $\det(M_{\basis_W}(\restr{\varphi}{W}))$ e $\det(M_{\basis_{W'}}(\restr{\varphi}{W}))$ (dove $\basis_{W'}$ è una base di $W'$) concordano di segno, $1$ a $\iota_-$, se
sono discordi, o $1$ a $\iota_0$ se l'ultimo di questi due determinanti è nullo.
Dal metodo di Jacobi si deduce il criterio di definitezza di Sylvester: $A$ è
definita positiva se e solo se $d_i > 0$$\forall1\leq i \leq n$; $A$ è
definita negativa se e solo se $(-1)^i d_i > 0$$\forall1\leq i \leq n$.
\subsubsection{Sottospazi isotropi e indice di Witt}
Si dice che un sottospazio $W$ di $V$ è isotropo se $\restr{\varphi}{W}=0$, o
equivalentemente se $W \subseteq W^\perp$ (i.e.~se $W \cap W^\perp= W$, e quindi
se $\Rad(\restr{\varphi}{W})= W$). Si definisce allora l'indice di Witt $W(\varphi)$ come
la dimensione massima di un sottospazio isotropo di $V$.
una base di Sylvester e costruire un nuovo insieme linearmente indipendente $\basis_W$ i cui i vettori sono o isotropi o della forma $\vv i -\ww i$, dove $q(\vv i)=1$ e $q(\ww i)=1$, mostrando che $W =\Span(\basis_W)$ è isotropo, concludendo con discussioni dimensionali),
\item Se $\KK=\CC$, allora $W(\varphi)=\lfloor\frac{\dim V +\dim V^\perp}{2}\rfloor$ (è sufficiente considerare una base di Sylvester per $\varphi$, costruire un nuovo insieme linearmente indipendente $\basis_W$ prendendo quante più coppie $(\vv i, \vv j)$ possibili di vettori della base non isotropi poi associate al vettore $\vv i + i \vv j$, mostrando infine che $W =\Span(\basis_W)$ è isotropo e che è sicuramente massimale perché realizza la dimensione massima possibile secondo le precedenti proposizioni),
\item Se $\KK=\RR$ e $\varphi$ è definito, allora $W(\varphi)=0$,
\item Se $\KK=\RR$ e $\varphi$ è semidefinito, allora $W(\varphi)= i_0$ (e $W = V^\perp$ è un sottospazio
Due spazi vettoriali $(V, \varphi)$ e $(W, \psi)$ su $\KK$ si dicono isometrici tra loro se
esiste un isomorfismo $f : V \to W$ tale che $\varphi(\vv1, \vv2)=\psi(f(\vv1), f(\vv2))$.
Se $f$ è un isomorfismo tra $V$ e $W$, sono equivalenti le seguenti affermazioni:
\begin{enumerate}[(i)]
\item$(V, \varphi)$ e $(W, \psi)$ sono isometrici tra loro tramite $f$,
\item$\forall\basis$ base di $V$, $M_\basis(\varphi)= M_{f(\basis)}(\psi)$,
\item$\exists\basis$ base di $V$, $M_\basis(\varphi)= M_{f(\basis)}(\psi)$.
\end{enumerate}
Inoltre, $V$ e $W$ sono isometrici se e solo se hanno la stessa dimensione e le matrici associate
a $\varphi$ e $\psi$ in due basi di $V$ e di $W$ sono congruenti (infatti, in tal caso, esistono due
basi di $V$ e di $W$ che condividono la stessa matrice associata, ed è possibile associare ad uno
ad uno gli elementi di queste basi).
Pertanto, se $\basis_V$ e $\basis_W$ sono due basi di $V$ e di $W$, $\KK=\RR$ e $M_{\basis_V}(\varphi)$ e $M_{\basis_W}(\psi)$ condividono la stessa segnatura, allora $V$ e $W$ sono
isometrici tra loro (come conseguenza del teorema di Sylvester reale).
Analogamente, se $\KK=\CC$ e $M_{\basis_V}(\varphi)$ e $M_{\basis_W}(\psi)$ condividono lo stesso
rango, allora $V$ e $W$ sono isometrici tra loro (come conseguenza stavolta del teorema di Sylvester
\subsection{Trasposta e aggiunta di un'applicazione}
Sia $(V, \varphi)$ uno spazio dotato di un prodotto $\varphi$ non degenere. Allora si definisce $f^*\in\End(V)$ (talvolta indicato come $f^\top$ se $\varphi$ non è hermitiano, quando è chiaro che non ci stia riferendo alla trasposizione dell'operatore $f$)
come l'unico operatore tale per cui $\varphi(f^*(\v), \w)=\varphi(\v, f(\w))$.
In particolare, se $\varphi$ non è hermitiano, tale operatore soddisfa la seguente relazione:
D'ora in poi si intenderà con $f^\top$ il trasposto di $f$ (con $\varphi$ scalare) e con $f^*$ l'aggiunto di $f$ (con $\varphi$ hermitiano). \\\vskip 0.05in
Un'operatore $f$ si dice \textit{simmetrico} se $f = f^\top$ e quindi se $\varphi(\v, f(\w))=\varphi(f(\v), \w)$ (analogamente un'operatore si dice \textit{hermitiano} se $f = f^*$). \\
Un'operatore $f$ si dice \textit{ortogonale} se è un'isometria da
$(V, \varphi)$ in $(V, \varphi)$, ossia se e solo se $\varphi(\v, \w)=\varphi(f(\v), f(\w))$ (analogamente un'operatore si dice \textit{unitario} se è un'isometria con
\item se $f$ è invertibile, $(f^\top)\inv=(f\inv)^\top$ (è sufficiente mostrare che $\varphi((f^\top\circ(f\inv)^\top)(\v), \w)=\varphi(\v, \w)$ e dedurre,
sottraendo i due membri, che deve valere $f^\top\circ(f\inv)^\top=\Idv$),
\item se $f$ è invertibile, $(f^*)\inv=(f\inv)^*$ (come sopra),
\item$\Ker f^\top=(\Im f)^\perp$,
\item$\Ker f^*=(\Im f)^\perp$,
\item$\Im f^\top=(\Ker f)^\perp$,
\item$\Im f^*=(\Ker f)^\perp$,
\item se $W$ è un sottospazio di $V$, allora $W$ è $f$-invariante se e solo
e ha spettro $\{\pm1\}$, dal momento che il suo polinomio minimo è $x^2-1$ (infatti $(f^\top)^\top= f$ e gli autospazi relativi a $1$ e $-1$ sono entrambi diversi da $\zerovecset$),
\item l'autospazio $V_1$ di $\top$ raccoglie gli operatori simmetrici, mentre
Si dice che $(V, \varphi)$ è uno spazio euclideo reale se $V$ è un $\RR$-spazio e se
$\varphi$ è un prodotto scalare definito positivo. Si dice che $(V_\CC, \varphi_\CC)$ è uno spazio euclideo complesso se $V_\CC$ è un $\CC$-spazio e se $\varphi_\CC$ è un
prodotto hermitiano definito positivo.
Questi due tipi di spazi hanno in comune alcune proprietà particolari. Si definisce
innanzitutto la norma euclidea per uno spazio euclideo $(V, \varphi)$ come:
Su questi due spazi possono essere definiti due particolare operatori: la
proiezione ortogonale e l'inversione ortogonale.
Si definisce proiezione ortogonale su un sottospazio $W \neq\zerovecset$ l'operatore $\pr_W \in\End(V)$ tale
che $\pr_W(\v)=\w$, dove $\v=\w+\w^\perp$, con $\w\in W$ e $\w^\perp\in W^\perp$. Tale decomposizione è ben definita e unica dacché $V = W \oplus^\perp W^\perp$ (infatti $\varphi$ è definita positiva). Una proiezione ortogonale
soddisfa la relazione $\pr_W^2=\pr_W$, da cui si ricava che $\varphi_{\pr_W}\mid x(x-1)$ (implicandone la diagonalizzabilità). Infatti $V_1=\Ker(\pr_W -\Idv)= W$ e $V_0=\Ker(\pr_W)= W^\perp$ (per cui $\varphi_{\pr_W}(x)= x(x-1)$). La
proiezione ortogonale è un operatore simmetrico (se lo spazio è euclideo reale)
o hermitiano (se lo spazio è euclideo complesso); infatti vale che
Si definisce inversione ortogonale su un sottospazio $W \neq\zerovecset$ l'operatore $\rho_W \in\End(V)$ tale
che $\rho_W(\v)=\w-\w^\perp$, dove $\v=\w+\w^\perp$, con $\w\in W$ e $\w^\perp\in W^\perp$. Come prima, tale decomposizione è unica e ben definita. Un'inversione ortogonale
soddisfa la relazione $\rho_W^2=\Idv$, da cui si ricava che $\varphi_{\rho_W}\mid(x+1)(x-1)$ (implicandone la diagonalizzabilità). Infatti $V_1=\Ker(\rho_W -\Idv)= W$ e $V_{-1}=\Ker(\rho_W +\Idv)= W^\perp$ (per cui $\varphi_{\rho_W}(x)=(x+1)(x-1)$). Se $\dim W =\dim V -1$, allora si dice che l'inversione ortogonale
è una riflessione ortogonale. L'inversione ortogonale è sempre un operatore
ortogonale (se lo spazio è euclideo reale) o unitario (se lo spazio è euclideo
complesso); infatti vale che $\varphi(\v, \w)=\varphi(\pr_W(\v)+\pr_{W^\perp}(\v), \pr_W(\w)+\pr_{W^\perp}(\w))=\varphi(\pr_W(\v), \pr_W(\w))+\varphi(\pr_{W^\perp}(\v), \pr_{W^\perp}(\w))=\varphi(\pr_W(\v), \pr_W(\w))+\varphi(-\pr_{W^\perp}(\v), -\pr_{W^\perp}(\w))=\varphi(\pr_W(\v)-\pr_{W^\perp}(\v), \pr_W(\w)-\pr_{W^\perp}(\w))=\varphi(\rho_W(\v), \rho_W(\w))$.
Sia $(V, \varphi)$ uno spazio euclideo reale. Se $f$ è un operatore simmetrico, allora
$f$ ammette solo autovalori reali. Prendendo infatti il prodotto hermitiano complessificato di $\varphi$, allora, se $\lambda$ è un autovalore in $\CC$ di $f$,
$\conj{\lambda}\varphi(\v, \v)=\varphi(\lambda\v, \v)$$=\varphi(f(\v), \v)=\varphi(\v, f(\v))=\varphi(\v, \lambda\v)=\lambda\varphi(\v, \v)$, dove $\v$ è un autovettore non nullo relativo
a $\lambda$; pertanto $\lambda=\conj{\lambda}\implies\lambda\in\RR$ dacché $\varphi(\v, \v)\neq0$). Seguendo gli stessi passaggi algebrici si mostra
che se $f$ è un operatore hermitiano uno spazio euclideo complesso, questo
ammette solo autovalori reali. \\\vskip 0.05in
Se $f$ è simmetrico o hermitiano, allora $V_\lambda\perp V_\mu$ se $\lambda$ e
$\mu$ sono due autovalori distinti. Infatti, se $\v$ è un autovettore relativo a $\lambda$ e $\w$ è un autovettore relativo a $\mu$, allora\footnote{$\lambda$ non è stato coniugato come argomento del prodotto dal momento che per il risultato precedente è reale, e quindi $\conj\lambda=\lambda$.}$\lambda\varphi(\v, \w)=
\varphi(\lambda\v, \w) = \varphi(\v, \mu\w) = \mu\varphi(\v, \w)$; poiché
$\lambda\neq\mu$ deve allora per forza valere $\varphi(\v, \w)=0$.
Se $f$ è simmetrico o hermitiano, esiste sempre una
base ortonormale di autovettori (\textit{teorema spettrale}). Se così non fosse, detto $W = V_{\lambda_1}\oplus^\perp\cdots\oplus^\perp V_{\lambda_k}$, $W^\perp$ sarebbe $f$-invariante e simmetrico/hermitiano, e dunque ammetterebbe un autovalore reale, contrariamente a quanto ipotizzato, \Lightning. Alternativamente, poiché
$f$ è simmetrico (e in tal caso anche perché il
polinomio caratteristico è completamente fattorizzabile in $\RR$) o hermitiano, $f$ è anche
normale, ed è dunque diagonalizzabile; allora, poiché gli autospazi sono in somma diretta ortogonale, $f$ è anche ortogonalmente o unitariamente diagonalizzabile. \\\vskip 0.05in
In termini matriciali, se $A$ è una matrice
simmetrica a elementi reali (o hermitiana a elementi complessi), esiste una matrice $O \in O(n)$ (o $U \in U(n)$) tale per cui $O^\top A O$ (o $U \in U(n)$) è diagonale. Infatti $f_A$, l'operatore
indotto da $A$ nella base ortonormale di $\RR^n$ (o $\CC^n$), è un operatore simmetrico (o hermitiano) rispetto al prodotto standard dello
\subsubsection{Radice quadrata di una matrice simmetrica, decomposizione polare e simultanea ortogonalizzabilità}
Se $A \in\Sym(n, \RR)$ è semidefinita positiva, allora
esiste sempre una matrice $S \in\Sym(n, \RR)$ tale
per cui $S^2= A$. Se si suppone anche che $S$ è
semidefinita positiva, tale matrice diventa unica e
viene detta \textit{radice quadrata} di $A$, indicata come $\sqrt{A}$. \\
Per costruire tale radice quadrata è sufficiente
considerare $P \in O(n)$ tale per cui
$P^\top A P = D$, dove $D \in M(n, \RR)$ è
diagonale, secondo il teorema spettrale. Poiché $A$ è semidefinita positiva, $D$
si compone di soli elementi non negativi, ed è
dunque possibile costruire la matrice $\sqrt{D}\in M(n, \RR)$ dove $\sqrt{D}_{ii}=\sqrt{D_{ii}}$ (da cui si deduce che $\sqrt{D}^2= D$ e che $\sqrt{D}$ è esattamente la radice quadrata di $D$).
Si consideri dunque $S = P \sqrt{D} P^\top$; vale
che $S^2= P D P^\top= A$, e dunque $S$ è la
radice quadrata $\sqrt{A}$ di $A$ (per dimostrare l'unicità di tale matrice è sufficiente ridursi all'uguaglianza negli autospazi). Si osserva che
se $A$ è definita positiva, anche $S$ lo è. \\\vskip 0.05in
Se $A \in M(n, \RR)$ esistono e sono uniche le
matrici $P \in O(n)$, $S \in\Sym(n, \RR)$, con $S$ semidefinita positiva, tali per
cui $A = PS$. In particolare vale che $S =\sqrt{A A^\top}$; se dunque $A \in\GL(n, \RR)$, $S$ è
definita positiva (in tal caso $\Ker A^\top A =\Ker A =\zerovecset$ -- come visto nella sezione sulle matrici --, e dunque $\vec x^\top A^\top A \vec x =\innprod{A \vec x, A \vec x} > 0$$\implies A^\top A > 0\implies S > 0$).
Se $A \in\GL(n, \RR)$, esistono e sono unici $P \in O(n)$,
Sia $G$ un gruppo e $X$ un insieme. Un'azione sinistra\footnote{Un'azione sinistra induce sempre anche un'azione destra, ponendo $x \cdot g=g^{-1}\cdot x$.} di $G$ su $X$ a sinistra un'applicazione $\cdot : G \times X \rightarrow X$, per la quale si pone $g \cdot x :=\cdot(g, x)$, tale che:
\begin{enumerate}[(i)]
\item$e \cdot x=x$, $\forall x \in X$, dove $e$ è l'identità di $G$,
\item$g \cdot(h \cdot x)=(gh)\cdot x$, $\forall g, h \in G$, $\forall x \in X$.
\end{enumerate}
Si definisce l'applicazione $f_g:X\rightarrow X$ indotta dalla relazione $f_g(x)=g \cdot x$; tale applicazione è bigettiva. Se $\cdot$ è un'azione sinistra di $G$ su $X$, si dice che $G$ opera a sinistra su $X$ e che $X$ è un $G$-insieme. \\
\vskip 0.05in
Si definisce \textit{stabilizzatore} di $x \in X$ il sottogruppo di $G$$\Stab_G(x)$
dove si scrive $\Stab(x)$ per indicare $\Stab_G(x)$ qualora non fosse ambigua
l'azione a cui ci si riferisce. \\
Si può costruire un omomorfismo $\tau : G \rightarrow S_X$, dove $(S_x, \circ)$ è il gruppo delle bigezioni di $X$, dove $\tau(g)= f_g$. Si dice che l'azione di $G$ su $X$ è \textit{fedele} se l'omomorfismo $g \rightarrow f_g$ è iniettivo, ossia
se e solo se:
\[ f_g =\IdV{X}\implies g = e, \]
ossia se e solo se:
\[\bigcap_{x \in X}\Stab(x)=\{e\}. \]
Per esempio, $S_X$ opera fedelmente su $X$ tramite l'azione indotta dalla relazione $g \cdot x=g(x)$ (ed è in realtà anche un'azione transitiva). $G$ stesso opera su $G$
tramite l'azione banale indotta dalla relazione $g \cdot g'=gg'$.
Si definisce su $X$ la relazione $x \sim_G y \iff\exists g \in G$ t.c.~$y=g \cdot x$.
La relazione $\sim_G$ è una relazione d'equivalenza: due elementi equivalenti tramite $\sim_G$ si dicono coniugati tramite $G$. Le classi di equivalenza si dicono orbite di $G$. In particolare si definisce $\Orb(x)= O_x$, con $x \in X$, come $[x]_{\sim_G}$,
ossia come la classe di equivalenza di $x$ rispetto a $\sim_G$.
Si presentano alcuni esempi di orbite:
\begin{enumerate}
\item$\GL(n,\KK)$ opera su $M(n,\KK)$ tramite la similitudine e le orbite sono le classi di matrici simili, rappresentate dalle forme canoniche di Jordan,
\item$\GL(n,\KK)$ opera su $\Sym(n,\KK)$ tramite la congruenza e le orbite sono le classi di matrici congruenti, rappresentate in $\RR$ dalle matrici diagonali con $1$, $-1$ e $0$ come elementi, e in $\CC$ dalle stesse matrici rappresentanti delle classi
\item$O_n$ agisce naturalmente su $\RR^n$ e l'orbita di $\vec x \in\RR^n$ è la sfera di raggio $\norm{\vec x}$ secondo il prodotto scalare standard di $\RR^n$.
Vale il teorema di orbita-stabilizzatore: l'applicazione $f:G/\Stab_G(x)\rightarrow\Orb(x)$ tale che $g \Stab_G(x)\mapsto g \cdot x$ è una bigezione tra
$G/\Stab_G(x)$ e $\Orb(x)$ (tale teorema è un analogo del primo teorema di
omomorfismo per i gruppi). Se $G$ è finito, vale allora che $\abs{G}=\abs{\Stab_G(x)}\cdot\abs{\Orb(x)}$.
Si dice che $G$ opera \textit{liberamente} su $X$ se $\forall x \in X$ l'applicazione
da $G$ in $X$ tale che $g \mapsto g \cdot x$ è iniettiva, ossia se e solo se $\Stab_G(x)=\{e\}$, $\forall x \in X$. Se $G$ opera liberamente su $X$,
$G$ opera anche fedelmente su $X$.
Si dice che $G$ opera \textit{transitivamente }su $X$ se $x \sim_G y$, $\forall x,y \in X$, cioè se esiste un'unica orbita, che coincide dunque con $G$. In tal caso
si dice che $X$ è \textit{omogeneo} per l'azione di $G$, oppure che
$X$ è $G$-omogeneo.
Si presentano alcuni esempi di azioni transitive:
\begin{enumerate}
\item$O_n$ opera transitivamente sulla sfera $n$-dimensionale di $\RR^n$,
\item Sia $\Gr_k(\RR^n)=\{W \text{ sottospazio di }\RR^n | \dim W=k\}$ la Grassmanniana di ordine $k$ su $\RR^n$. Allora $O_n$ opera transitivamente su $\Gr_k(\RR^n)$.
\end{enumerate}
Si dice che $G$ opera in maniera \textit{semplicemente transitiva} su $X$ se opera transitivamente e liberamente su $X$; in tal caso si dice che $X$ è un insieme $G$-omogeneo principale. Equivalentemente $G$ opera in maniera semplicemente transitiva se $\exists x\in X$ t.c.~$g\rightarrow g \cdot x$ è una bigezione.
Se $X$ è un insieme $G$-omogeneo e $G$ è abeliano, allora $G$ agisce fedelmente su $X$$\iff$$X$ è $G$-insieme omogeneo principale (per dimostrare l'implicazione a destra è sufficiente mostrare che, se $x \in X$, $g \in\Stab(x)\implies f_g =\IdV{X}$, da cui si conclude
$V$ è uno spazio vettoriale, inteso in tal senso come il gruppo abeliano
$(V, +)$. Si scrive in tal caso l'azione $\v\cdot P$ come $P +\v$. Equivalentemente $E$ è uno spazio affine se $\forall P$, $Q \in E$, $\exists!\,\v\in V$ t.c. $P +\v= Q$. In particolar modo, ci si riferisce a $\v\mid P +\v= Q$ come $Q - P$ o
$\overrightarrow{PQ}$.
Valgono le seguenti proprietà generali:
\begin{itemize}
\item fissato $\v\in V$, l'applicazione da $E$ in $E$ tale che $P \mapsto P+\v$ è una bigezione,
\item fissato $O \in E$, l'applicazione da $V$ in $E$ tale che $\v\mapsto O+\v$ è una bigezione,
\item fissato $O \in E$, l'applicazione da $E$ in $V$ tale che $P \mapsto P-O$ è una bigezione ed è l'inversa della bigezione presentata nello scorso punto.
Pertanto un punto $P\in E$ si dice \textit{combinazione affine} dei punti $P_1$, ..., $P_k$ se $\exists\lambda_1$, ..., $\lambda_k \in\KK$ tali che $\sum_{i=1}^{k}\lambda_i=1$ e che $\forall O \in E$,
$P=O+\sum_{i=1}^{k}\lambda_i (P_i-O)$. Si scrive in tal caso $P=\sum_{i=1}^{k}\lambda_i P_i$ (la notazione è ben definita dal momento che
non dipende da $O$ per l'asserzione precedente).
Un sottoinsieme $D\subseteq E$ si dice \textit{sottospazio affine} se è chiuso per combinazioni affini. Il sottospazio affine $D \subseteq E$ generato da un sottoinsieme $S \subseteq E$ è l'insieme delle combinazioni affini (finite) dei punti di $S$;
si denota tale sottospazio affine $D$ come $\Aff(S)$. Vale inoltre che $\Aff(S)$ è il
Ogni spazio vettoriale $V$ su $\KK$ induce uno spazio affine tramite l'azione banale che compie $(V, +)$ su $(V, +)$, ossia con $\v\cdot\w=\v+\w=\w+\v$, dove l'operazione $+$ coincide sia con la somma affine che
con quella vettoriale.
In questo caso una combinazione affine diventa un caso particolare di combinazione lineare. Lo spazio affine
generato in questo modo su $\KK^n$ viene detto \textit{spazio affine standard} ed è indicato come $\AnK$. \\\vskip 0.05in
Se $E$ è uno spazio affine sul $\KK$-spazio $V$, allora ogni scelta di un punto $O \in E$ e di una base $\mathcal{B}$ di $V$ induce la bigezione naturale
$\varphi_{O,\mathcal{B}} : E \to\AnK$ tale che $\varphi_{O,\mathcal{B}}(P)=[P-O]_\basis$, dove $P \in E$.
Un sottoinsieme $D \subseteq E$ è un sottospazio affine $\iff\forall P_0\in D$,
$D_0=\{P-P_0\mid P\in D\}\subseteq V$ è un sottospazio vettoriale di $V$.
Si può allora scrivere che $D=P_0+D_0$, ossia si deduce che $D$ è il traslato di $D_0$ per $P_0$, e quindi
che ogni sottospazio affine è in particolare il traslato
di un sottospazio vettoriale.
L'insieme $D_0$, scritto anche come $\Giac(D)$, è detto \textit{direzione} (o \textit{giacitura}) del sottospazio affine $D$ ed è invariante per la scelta
del punto $P_0$; in particolare vale che $D_0=\{ Q - P \mid P, Q \in D \}$.
Si definisce la dimensione di un sottospazio affine $D$ come la dimensione della sua direzione $D_0$. In particolare $\dim E =\dim V$. Quindi, così come accade per gli spazi vettoriali, i sottospazi affini di dimensione nulla corrispondono ai punti di $E$, quelli di dimensione unitaria corrispondono alle \textit{rette} di $E$, quelli di dimensione $2$ corrispondono ai \textit{piani}, mentre quelli di codimensione unitaria (ossia di dimensione $\dim V -1$) corrispondono agli \textit{iperpiani affini}.
I punti $P_1$, ..., $P_k$ sono affinemente indipendenti se e solo se $\forall i=1\text{---}k$ i vettori $P_j-P_i$ con $j \neq i$ sono linearmente indipendenti in $V$$\iff\forall i=1\text{---}k$, $P_i \notin\Aff(S \setminus\{P_i\})$,
dove $S =\{P_1, \ldots, P_k\}$. Pertanto, possono
esistere al più $\dim D_0+1$ punti affinemente
indipendenti in $D$. In particolare, se si scelgono
$n+1$ punti $P_0$, ..., $P_n \in E$ affinemente
indipendenti, vale che $\Aff(P_0, \ldots, P_n)= E$ (in tal caso infatti la direzione sarebbe tutto $V$).
Esistono sempre $P_0$, ..., $P_n$ punti di $D$ tali
che $\Aff(P_0, \ldots, P_n)= D$, se $\dim D = n$;
in tal caso l'insieme di questi punti viene detto
\textit{riferimento affine}. Ogni riferimento affine ha
lo stesso numero di elementi (in generale valgono
le stesse proprietà di una base vettoriale, mediante
Sia $E =\AnK$ allora $\ww1$, ..., $\ww n \in E$ sono affinemente indipendenti se e solo se i vettori $\hat{\ww1}$, ..., $\hat{\ww n}$ con $\hat{\ww i}=\Matrix{\ww i \\[0.03in]\hline1}=\iota(\ww i)\in\KK^{n+1}$ sono linearmente indipendenti. \\\vskip 0.05in
scalari $\lambda_i$ in $\KK$ tali per cui $P =\sum_{i=0}^k \lambda_i P_i$, eccetto per uno di questi scalari che è già determinato dagli altri (infatti vale sempre $\sum_{i=0}^k \lambda_i =1$). Vi è dunque una bigezione tra $D$ e $\mathcal{A}_k(\KK)$. L'immagine di $P$
Si dice \textit{combinazione convessa} una qualsiasi
combinazione affine finita in un insieme di punti affinemente indipendenti $S$ in cui ogni coordinata affine è maggiore o
uguale a zero. Si pone in particolare $\IC(S)$ come
l'insieme di questo tipo di combinazioni (intuitivamente un inviluppo convesso è l'insieme dei punti contenuti "dentro" il riferimento affine scelto; per tre punti è il triangolo, per due punti è il segmento). Si scrive $\IC(P_1, \ldots, P_k)$ per indicare $\IC(\{P_1, \ldots, P_k\})$. \\\vskip 0.05in
Si osserva che $\IC(S)$ è un insieme
convesso (ossia $\forall P, Q \in\IC(S)$, $[P, Q]\subseteq\IC(S)$, dove $[P, Q] :=\IC(\{P, Q\})$ è il segmento congiungente $P$ e $Q$).
Se $D$ è un sottospazio affine di $E$$f$-invariante,
allora $\restr{f}{D}$ è ancora un'applicazione affine.
Esiste ed è unica l'applicazione lineare $g : V \rightarrow V'$ tale che $f(P)=f(O)+g(P-O)$ per ogni scelta di $P$, $O \in E$; tale applicazione lineare
si denota con $df$ e viene detta \textit{differenziale} di $g$. Analogamente si può sempre costruire un'applicazione affine tale per cui $df=g$, data
Nel caso in cui $E=\mathcal{A}_n(\KK)$, $E'=\mathcal{A}_m(\KK)$, un'applicazione affine $f$ è della forma $f(\x)=f(\Vec{0})+g(\x)=A \x+\Vec{b}$ con $A\in M(m,n,\KK)$ e $\Vec{b}\in A_m(\KK)$. \\\vskip 0.05in
Sia $E''$ un altro spazio affine associato a $V''$. Se $f':E'\rightarrow E''$ è affine, allora $f'\circ f:E\rightarrow E''$ è affine e vale $d(f' \circ f)= df' \circ df$.
L'applicazione $\pi : A(E)\rightarrow\GL(V) : f \mapsto g$ è un omomorfismo surgettivo il cui nucleo è dato dalle traslazioni, che pertanto formano un sottogruppo normale.
Sia $f \in A(E)$. Allora $d(f\inv)= df\inv$; in particolare, se $E =\AnK$, $f\inv(\vec x)= A\inv\vec x - A\inv\vec b$, dove $f(\vec x)= A \vec x +\vec b$.
Allora esiste un'unica applicazione lineare $\hat f \in\End(\KK^{n+1})$ che estende $f$ in $\mathcal{A}_{n+1}(\KK)$ tale per cui
$f(\iota(\x))=\iota(f(\x))$; in particolare tale
applicazione è rappresentata dalla matrice $\hat A$, dove:
\[\hat{A}=\Matrix{ A &\rvline&\vec b \,\\\hline0&\rvline&1\,}. \]
In particolare $\hat A$ dipende da $n^2+ n$ parametri; se si fosse posto $f(D)= D$, sarebbe dipesa invece da $k(k+1)+ n(n-k)$ parametri. Le matrici di questa forma formano un sottogruppo di $\GL_{n+1}(\KK)$ isomorfo ad $A(\AnK)$.
\item se $f\in A(E)$ e i punti $P_0$, ..., $P_n \in E$ sono affinemente indipendenti, allora anche i punti $f(P_0)$, ..., $f(P_n)$ sono affinemente indipendenti,
\item se $\dim E_0= n$, i punti $P_0$, ..., $P_n$ sono affinemente indipendenti e anche i punti $Q_0$, ... $Q_n$ sono affinemente indipendenti, allora esiste ed è unica l'affinità $f : E \rightarrow E$ tale che $f(P_i)=Q_i \forall i=1\text{---}n$,
\item se $f\in A(E)$, $D \subseteq E$ sottospazio affine $\implies f(D)$ è un sottospazio affine della stessa dimensione.
Siano ($P_1$, $P_2$, $P_3$), ($Q_1$, $Q_2$, $Q_3$) due terne di punti distinti di $\mathcal{A}_1(\KK)$. Allora esiste ed è unica l'applicazione affine $f \in A(\mathcal{A}_1(\KK))$ tale che $f(P_i)=Q_i$$\forall i=1,$$2$, $3$$\iff\lambda(P_1, P_2, P_3)=\lambda(Q_1, Q_2, Q_3)$, dove $\lambda(P_1,P_2,P_3)$ è detto \textit{rapporto semplice} ed è definito come:
\item$A(\AA_1(\KK))$ agisce transitivamente su $\mathcal{A}_1(\KK)$,
$\Stab(x_0)=\{f\mid f(x_0)=x_0\}\cong\GL_1(\KK)$ (infatti la matrice associata all'affinità dipende da un solo parametro),
\item$\abs{\Fix(f)}\leq1$, e
$\abs{\Fix(f)}=0\iff f$ è una traslazione, dove $\Fix(f)=\{x\in\mathcal{A}_1(\KK)\mid f(x)=x\}$,
\item$A(\mathcal{A}_1(\KK))$ agisce in maniera semplicemente transitiva sulle coppie di punti $(P_1,P_2)\in\AA_1(\KK)\times\AA_1(\KK)$ con $P_1\neq P_2$.
Si definisce \textit{spazio proiettivo} relativo a $\KK^{n+1}$ l'insieme delle rette di $\KK^{n+1}$. Tale spazio viene denotato come $\PP(\KK^{n+1})=\PP^n(\KK)$ (intuitivamente lo spazio proiettivo perde una dimensione rispetto allo spazio di partenza perché è la proiezione di tutte le rette in un unico punto, eccetto per i punti all'infinito).
Equivalentemente lo spazio proiettivo è l'insieme quoziente di $\KK^{n+1}$ tramite
la relazione di equivalenza $\sim$ dove $\vec x \sim\vec y \defiff\exists\lambda\in\KK, \lambda\neq0\mid\vec x =\lambda\vec y$.
Ogni punto $\vec x \in\KK^n$ individua un unico sottospazio di dimensione unitaria in $\KK^{n+1}$ tramite $\iota$, ossia: $\Span(\iota(\vec x))=\Span(\projT\x)$. L'insieme di rette non individuate tramite elementi di $\KK^n$ è in particolare formato dalle rette appartenenti al piano $\{\x\in\KK^{n+1}\mid x_{n+1}=0\}\cong\KK^n$; dal momento che queste rette si identificano come tutte le rette di $\KK^n$, esse rappresentano in particolare lo spazio proiettivo di una dimensione ancora minore, $\PP^{n-1}(\KK)$.
Le rette appartenenti al piano $\{\x\in\KK^{n+1}\mid x_{n+1}=0\}$ sono dette \textit{punti all'infinito} di $\PP^n(\KK)$ (intuitivamente un punto all'infinito indica la direzione dei vari infiniti del piano).
Si può ricoprire $\PP^n(\KK)$ con gli iperpiani $H_i=\{\x\in\mathcal{A}_{n+1}(\KK)\mid x_{i}=1\}$ dal momento che ogni retta deve intersecare almeno uno di questi iperpiani in un punto.
\[\MM(p)=\Matrix{\AA(p)&\rvline&\Ll(p)\,\\\hline\Ll(p)&\rvline& c(p)}\in\Sym(n+1, \KK),\] la quale viene detta \textit{matrice associata alla quadrica} in $p$. Si dice che la quadrica relativa a $p$ è \textit{non degenere} se $\rg(\MM(p))= n+1$. Allora, tramite l'identificazione di $\Aa_n(\KK)$ in $H_{n+1}\subset\KK^{n+1}$ mediante $\iota$, vale che:
Si deduce allora che una quadrica altro non è che la controimmagine tramite $\iota$
dell'intersezione tra $H_{n+1}$ e il cono isotropo $\CI(\varphi_{\MM(p)})$, dove
$\varphi_{\MM(p)}$ è il prodotto scalare indotto da $\MM(p)$ in $\KK^{n+1}$ (i.e.~la quadrica è esattamente $\iota\inv(H_{n+1}\cap\CI(\varphi_{\MM(p)}))$).
Sia $f\in A(\AnK)$ tale per cui $f(\x)=M\x+\vec t$, con $M\in\GL(n, \KK), \vec t \in\KK^n$. Si definisce allora un'azione destra di $A(\AnK)$ sulle quadriche di
$n$ variabili, dove $p \cdot f$ è indicato come $p \circ f$, che a sua volta
indica il polinomio $p(f(\x))= p(M\x+\vec t)$. Il luogo di zeri $Z(p)$ di una quadrica
su cui agisce $A(\AnK)$ varia a sua volta secondo l'affinità; in particolare vale che:
\[ Z(p)= f(Z(p \circ f)). \]
Si definisce allora una relazione di equivalenza detta \textit{equivalenza affine},
dove:
\[ p \sim q \defiff\exists\lambda\in\KK^*, f \in A(\AnK)\mid p =\lambda(q \circ f). \]
dove $\vec t \in\AnK$; in particolare tale $\vec{x_0}$ è detto \textit{centro di simmetria}. Vale in particolare che $\vec0$ è un centro di simmetria di $p$ se
e solo se $\Ll(p)=\vec0$. \\\vskip 0.05in
Inoltre vale che $\vec{x_0}$ è un centro di simmetria di $p$ se e solo se $p \circ f$ ha centro di simmetria
$\vec0$ tramite
la traslazione $f(\x)=\x+\vec{x_0}$; pertanto $p$ è a centro se e solo se è risolvibile in $\vec{x_0}$ il sistema:
\[\Ll(p \circ f)=\AA(p)\vec{x_0}+\Ll(p)=\vec0.\]
Poiché allora i centri della quadriche sono soluzione di un sistema lineare, se esistono, essi formano un sottospazio affine di dimensione $n-\rg(\AA)$; in particolare, se $\vec{x_0}$ è un particolare centro, tale sottospazio affine $C$ è
\subsubsection{Classificazione delle coniche in $\CC$ ed $\RR$}
Esistono due tipi di classificazioni: una \textit{affine}, dove per ogni quadrica si trova una forma canonica per equivalenza affine tramite la moltiplicazione per scalare $\lambda$ e per applicazione delle affinità di $A(\AnK)$, e una \textit{isometrica}, dove si classificano le quadriche rispetto alle isometrie del gruppo delle isometrie $\Iso(\AnK)$ (e.g.~le ellissi in generale sono affinemente equivalenti, ma non sono isometricamente equivalenti), dove $\Iso(\AnK)$ è composto dalla affinità di $A(\AnK)$
che preservano la distanza tra punti, qualora definibile.