logo

Macierz kowariancji

Macierz kowariancji to rodzaj macierzy używanej do opisu wartości kowariancji pomiędzy dwoma elementami w wektorze losowym. Jest ona również nazywana macierzą wariancji-kowariancji, ponieważ wariancja każdego elementu jest reprezentowana wzdłuż głównej przekątnej macierzy, a kowariancja jest reprezentowana pomiędzy elementami niediagonalnymi. Macierz kowariancji jest zwykle macierzą kwadratową. Jest również dodatni, półokreślony i symetryczny. Ta macierz jest przydatna, jeśli chodzi o modelowanie stochastyczne i analizę głównych składowych.

maszynopis foreach

Co to jest macierz kowariancji?

The zmienność -macierz kowariancji to a macierz kwadratowa z elementami diagonalnymi, które reprezentują wariancję i składnikami niediagonalnymi, które wyrażają kowariancję. Kowariancja zmiennej może przyjmować dowolną wartość rzeczywistą – dodatnią, ujemną lub zero. Dodatnia kowariancja sugeruje, że te dwie zmienne mają dodatni związek, podczas gdy ujemna kowariancja wskazuje, że tak nie jest. Jeśli dwa elementy nie różnią się razem, mają zerową kowariancję.



Ucz się więcej, Matryca diagonalna

Przykład macierzy kowariancji

Załóżmy, że istnieją 2 zbiory danych X = [10, 5] i Y = [3, 9]. Wariancja zbioru X = 12,5 i wariancja zbioru Y = 18. Kowariancja pomiędzy obiema zmiennymi wynosi -15. Macierz kowariancji jest następująca:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Wzór macierzy kowariancji

Ogólna postać macierzy kowariancji jest podana w następujący sposób:

Macierz kowariancji

Gdzie,

  • Odchylenie próbki: gdzie (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Przykładowa kowariancja: (x1, I1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Wariancja populacji: gdzie (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Kowariancja populacji: (xN, IN) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Tutaj, M to średnia populacji

overline x oznacza średnią próbki

N to Liczba obserwacji

X I jest obserwacją w zbiorze danych x

Zobaczmy format macierzy kowariancji 2 ⨯ 2 i 3 ⨯ 3

2 2 Macierz kowariancji

Wiemy, że w 2 ⨯ 2 matryca są dwa wiersze i dwie kolumny. Zatem macierz kowariancji 2 ⨯ 2 można wyrazić jakoegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 3 Macierz kowariancji

W macierzy 3⨯3 znajdują się 3 wiersze i 3 kolumny. Wiemy, że w macierzy kowariancji elementy przekątne są wariancją, a elementy niediagonalne są kowariancją. Stąd macierz kowariancji 3⨯3 można podać jakoegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Jak znaleźć macierz kowariancji?

Wymiary macierzy kowariancji są określone przez liczbę zmiennych w danym zbiorze danych. Jeśli w zestawie znajdują się tylko dwie zmienne, wówczas macierz kowariancji będzie miała dwa wiersze i dwie kolumny. Podobnie, jeśli zbiór danych zawiera trzy zmienne, wówczas jego macierz kowariancji będzie miała trzy wiersze i trzy kolumny.

Dane dotyczą ocen uzyskanych przez Annę, Caroline i Laurę z psychologii i historii. Utwórz macierz kowariancji.

Student Psychologia(X) Historia (Y)
Ania 80 70
Karolina 63 20
Laura 100 pięćdziesiąt

Należy wykonać następujące kroki:

Krok 1: Znajdź średnią zmiennej X. Zsumuj wszystkie obserwacje zmiennej X i uzyskaną sumę podziel przez liczbę wyrazów. Zatem (80 + 63 + 100)/3 = 81.

Krok 2: Odejmij średnią od wszystkich obserwacji. (80 – 81), (63 – 81), (100 – 81).

Krok 3: Weź kwadraty różnic uzyskanych powyżej i dodaj je. Zatem (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

Krok 4: Znajdź wariancję X, dzieląc wartość uzyskaną w kroku 3 przez 1 mniej niż całkowita liczba obserwacji. zmienna(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

Krok 5: Podobnie powtórz kroki od 1 do 4, aby obliczyć wariancję Y. Var(Y) = 633.

Krok 6: Wybierz parę zmiennych.

Krok 7: Odejmij średnią pierwszej zmiennej (X) od wszystkich obserwacji; (80 – 81), (63 – 81), (100 – 81).

Krok 8: Powtórz to samo dla zmiennej Y; (70 – 47), (20 – 47), (50 – 47).

Krok 9: Pomnóż odpowiednie wyrazy: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).

Krok 10: Znajdź kowariancję, dodając te wartości i dzieląc je przez (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

Krok 11: Użyj ogólnego wzoru na macierz kowariancji, aby uporządkować wyrazy. Macierz staje się:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Właściwości macierzy kowariancji

Właściwości macierzy kowariancji są wymienione poniżej:

  • Macierz kowariancji jest zawsze kwadratowa, co oznacza, że ​​liczba wierszy w macierzy kowariancji jest zawsze równa liczbie zawartych w niej kolumn.
  • Macierz kowariancji jest zawsze symetryczna, co oznacza, że transponować macierzy kowariancji jest zawsze równa macierzy pierwotnej.
  • Macierz kowariancji jest zawsze dodatnia i półokreślona.
  • The wartości własne macierzy kowariancji są zawsze rzeczywiste i nieujemne.

Czytaj więcej,

  • Rodzaje macierzy
  • Mnożenie macierzy
  • Wariancja i odchylenie standardowe

Rozwiązane przykłady na macierzy kowariancji

Przykład 1: Poniżej podano oceny uzyskane przez 3 uczniów z fizyki i biologii:

StudentFizyka(X)Biologia (Y)
A 92 80
B 60 30
C 100 70

Oblicz macierz kowariancji na podstawie powyższych danych.

Rozwiązanie:

Przykładowa macierz kowariancji jest dana przezfrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Tutaj, mX= 84, n = 3

zmienna(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448

Zatem μI= 60, n = 3

zmienna(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700

Teraz cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

Macierz kowariancji populacji jest dana jako:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

Przykład 2. Przygotuj macierz kowariancji populacji z poniższej tabeli:

WiekLiczba ludzi
29 68
26 60
30 58
35 40

Rozwiązanie:

Wariancję populacji podaje się przezfrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Tutaj, mX= 56,5, n = 4

zmienna(x) = [(68 – 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2] / 4 = 104,75

Zatem μI= 30, n = 4

zmienna(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2] / 4 = 10,5

Teraz cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

Macierz kowariancji populacji jest dana jako: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Przykład 3. Zinterpretuj następującą macierz kowariancji:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

Rozwiązanie:

  1. Elementy przekątne 60, 30 i 80 wskazują odpowiednio wariancję w zbiorach danych X, Y i Z. Y pokazuje najniższą wariancję, podczas gdy Z wykazuje największą wariancję.
  2. Kowariancja dla X i Y wynosi 32. Ponieważ jest to liczba dodatnia, oznacza to, że gdy X wzrasta (lub maleje), Y również rośnie (lub maleje)
  3. Kowariancja dla X i Z wynosi -4. Ponieważ jest to liczba ujemna, oznacza to, że gdy X wzrasta, Z maleje i odwrotnie.
  4. Kowariancja Y i Z wynosi 0. Oznacza to, że nie ma przewidywalnej zależności pomiędzy dwoma zbiorami danych.

Przykład 4. Znajdź przykładową macierz kowariancji dla następujących danych:

XIZ
75 10,5 Cztery pięć
65 12.8 65
22 7.3 74
piętnaście 2.1 76
18 9.2 56

Rozwiązanie:

Przykładowa macierz kowariancji jest dana przezfrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

ciąg porównawczy

n = 5, mX= 22,4, zm.(X) = 321,2 / (5 – 1) = 80,3

MI= 12,58, zm(Y) = 132,148 / 4 = 33,037

Mz= 64, var(Z) = 570 / 4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

Macierz kowariancji jest dana jako:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Często zadawane pytania dotyczące macierzy kowariancji

1. Zdefiniuj macierz kowariancji

Macierz kowariancji to rodzaj macierzy używanej do opisu wartości kowariancji pomiędzy dwoma elementami w wektorze losowym.

2. Jaki jest wzór na macierz kowariancji?

Wzór na macierz kowariancji podano jako

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

Gdzie, Odchylenie próbki: gdzie (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Przykładowa kowariancja: (x1, I1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Wariancja populacji: gdzie (xN) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Kowariancja populacji: (xN, IN) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Jaka jest ogólna postać macierzy kowariancji 3 ⨯ 3?

Ogólną postać macierzy kowariancji 3 ⨯ 3 podaje się następująco:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Jakie są właściwości macierzy kowariancji?

Macierz kowariancji jest macierzą kwadratową i ma również charakter symetryczny, tj. transpozycja oryginalnej macierzy daje samą pierwotną macierz

5. W jakich sektorach można zastosować macierz kowariancji?

Macierz kowariancji jest wykorzystywana w matematyce, uczeniu maszynowym, finansach i ekonomii. Macierz kowariancji jest wykorzystywana w dekompozycji Cholskeya do wykonywania symulacji Monte Carlo, która jest używana do tworzenia modeli matematycznych.