Rozdział 2 Macierz danych
Macierz danych przedstawia zbiór \(n\) przypadków, każdy z nich opisany jest przez \(p\) zmiennych (cech). Kolumny \(X^{1},X^{2},\ldots,X^{p}\) są \(n\) - wymiarowymi wektorami cech. Wiersze \(X_{1},X_{2},\ldots,X_{n}\) są \(p\) - wymiarowymi wektorami przypadków. Zazwyczaj macierz danych (dla \(p=2\) ) jest przedstawiana jako 2-wymiarowy wykres \(n\) punktów (wykres rozrzutu)
Na przykład, jeżeli \(\mathbf{a}\) jest liczbą to \(\mathbf{a}^n\) jest \(n\) - wymiarowym wektorem \[ \begin{bmatrix} a \\ a \\ \vdots \\ a \end{bmatrix} \]
Wektory w macierzy \(X\) są zapisane w standardowym, kartezjańskim układzie współrzędnych o początku w punkcie \(\mathbf{0}\). Dla dowolnych wektorów \(A,B\), symbol \(AB\) oznacza wektor o początku w punkcie \(A\) i końcu w punkcie \(B\).
Dla macierzy danych \(X\) naturalny jest układ współrzędnych o centrum w środku ciężkości \(g(X)\). Taka operacja nazywa się centrowaniem \(X\) i oznacza symbolem \(X^0\). Mamy więc: \[ X^0=X-g(X)^n \]
Niech \(X\) i \(Y\) będą macierzami o wymiarach odpowiednio \(n \times p\) i \(n \times q\).
Macierzą kowariancji między \(X\) i \(Y\) jest macierz o wymiarach \(p\)x\(q\) \[ V(X,Y)=\frac{1}{n}\left(X^0\right)^TY^0 \] Macierzą wariancji dla \(X\) nazywamy macierz kwadratową o wymiarach \(p\)x\(p\): \(V(X)\stackrel{def}{=}V(X,X)\)
Niech \[ X^0=\begin{bmatrix} Z^1 & Z^2 & \cdots & Z^p \end{bmatrix} \] Standaryzacją macierzy \(X\) jest tablica: \[ S(X)=\begin{bmatrix} \frac{Z^1}{||Z^1||} & \frac{Z^2}{||Z^2||} & \cdots & \frac{Z^p}{||Z^p||} \end{bmatrix} \]
Symbol \(||A||\) oznacza długość wektora \(A\)
\(R(X)\stackrel{def}{=}R(X,X)\).