Zmienność jest wartością pomiaru używaną do ustalenia, w jaki sposób dane są rozłożone w odniesieniu do średniej lub średniej wartości zbioru danych. Służy do sprawdzenia, w jaki sposób dane dotyczące rozkładu są rozłożone w odniesieniu do średniej lub wartości średniej. Symbolem używanym do określenia wariancji jest σ2. Jest to kwadrat odchylenia standardowego.
W statystyce stosuje się dwa rodzaje wariancji:
- Odchylenie próbki
- Wariancja populacji
Wariancja populacji służy do określenia, jak każdy punkt danych w danej populacji ulega wahaniom lub jest rozłożona, podczas gdy wariancja próbki służy do znalezienia średniej kwadratów odchyleń od średniej.
W tym artykule dowiemy się o Wariancja (próbka, populacja), ich wzory, właściwości i inne szczegółowe informacje.
Spis treści
- Co to jest wariancja?
- Rodzaje wariancji
- Symbol odchylenia
- Przykład odchylenia
- Formuła wariancji
- Przykładowy wzór na wariancję
- Wzór na wariancję populacji
- Wzór na wariancję dla danych zgrupowanych
- Wzór na wariancję dla niezgrupowanych danych
- Wzór na obliczanie wariancji
- Jak obliczyć wariancję?
- Wariancja i odchylenie standardowe
- Wariancja i kowariancja
- Właściwości wariancji
- Przykłady dotyczące wzoru na wariancję
- Podsumowanie – wariancja
- Często zadawane pytania dotyczące wariancji
Co to jest wariancja?
Mierzymy różne wartości danych i wartości te są wykorzystywane do różnych celów. Dane mogą być podawane w dwóch rodzajach danych zgrupowanych lub danych niezgrupowanych (dyskretnych). Jeśli dane są podawane w postaci przedziałów klas, nazywane są danymi zgrupowanymi, natomiast jeśli dane są podawane w postaci pojedynczego punktu danych, określa się je jako dyskretny lub niezgrupowany punkt danych. Wariancja jest miarą rozproszenia danych dotyczącą średniej wartości danych. Mówi nam, jak dane są rozproszone w danej wartości. Możemy łatwo obliczyć wariancję próbki i wariancję populacji zarówno dla danych zgrupowanych, jak i niezgrupowanych.
Definicja wariancji
Zmienność jest miarą statystyczną, która określa ilościowo rozproszenie lub rozproszenie zbioru punktów danych. Wskazuje, jak bardzo poszczególne punkty danych w zbiorze danych różnią się od średniej (średniej) zbioru danych
Rodzaje wariancji
Wariancję danych możemy zdefiniować w dwóch typach,
- Wariancja populacji
- Odchylenie próbki
Teraz poznamy je szczegółowo.
Wariancja populacji
Wariancję populacji wykorzystuje się do znalezienia rozmieszczenia danej populacji. Populacja jest definiowana jako grupa ludzi i wszyscy ludzie w tej grupie są częścią populacji. Mówi nam o tym, jak populacja danej grupy zmienia się w stosunku do średniej populacji.
Wszyscy członkowie grupy nazywani są populacją. Kiedy chcemy sprawdzić, jak każdy punkt danych w danej populacji zmienia się lub jest rozłożony, używamy wariancji populacji. Służy do podania kwadratu odległości każdego punktu danych od średniej populacji.
Odchylenie próbki
Jeśli dane populacji są bardzo duże, obliczenie wariancji populacji zbioru danych staje się trudne. W takim przypadku pobieramy próbkę danych z danego zbioru danych i znajdujemy wariancję tego zbioru danych, co nazywa się wariancją próbki. Obliczając średnią próbki, pamiętajmy o obliczeniu średniej próbki, tj. średniej zbioru danych próbki, a nie średniej populacji. Możemy zdefiniować wariancję próbki jako średnią kwadratu różnicy między punktem danych próbki a średnią próbki.
Symbol odchylenia
Symbol wariancji jest zazwyczaj reprezentowany przez grecką literę sigma do kwadratu (σ²), gdy odnosi się do wariancji populacji. Wariancję próbki często oznacza się jako s².
Przykład odchylenia
Pojęcie wariancji możemy zrozumieć na przykładzie omówionym poniżej.
Znajdź wariancję populacji danych {4,6,8,10}
Rozwiązanie:
Średnia = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Wariancja = (9+1+1+9)/4 = 20/4 = 5
Zatem wariancja danych wynosi 5
Formuła wariancji
Wariancja zbioru danych jest oznaczona symbolem σ2. W przypadku danych populacyjnych jego wzór jest równy sumie kwadratów różnic wpisów danych od średniej podzielonej przez liczbę wpisów. Natomiast w przypadku danych przykładowych wartość licznika dzielimy przez różnicę między liczbą wpisów a jednością.
Przykładowy wzór na wariancję
Jeśli zbiór danych jest próbą, wzór na wariancję jest określony przez:
P 2 = ∑ (x I - X) 2 /(n – 1)
Gdzie,
- X jest średnią przykładowego zbioru danych
- N to całkowita liczba obserwacji
Wzór na wariancję populacji
Jeśli mamy zbiór danych populacji, wzór zapisuje się jako:
P 2 = ∑ (x I - X) 2 /N
Gdzie,
- X jest średnią zbioru danych populacji
- N to całkowita liczba obserwacji
Możemy również obliczyć wariancję dla zgrupowanych i niezgrupowanych zbiorów danych. Różne wzory na wariancję to:
javafx na zaćmieniu
Wzór na wariancję dla danych zgrupowanych
W przypadku danych pogrupowanych wzór na wariancję omówiono poniżej:
Przykładowy wzór na wariancję dla zgrupowanych danych (σ 2 ) = ∑ f(m I - X) 2 /(n-1)
Wzór na wariancję populacji dla danych zgrupowanych (P 2 ) = ∑ f(m I - X) 2 /N
Gdzie,
- F jest częstotliwością każdego przedziału
- M I jest środkiem itinterwał
- X jest średnią zgrupowanych danych
W przypadku danych pogrupowanych średnią oblicza się jako:
Średnia = ∑ (np I X I ) / ∑ f I
Wzór na wariancję dla niezgrupowanych danych
W przypadku danych niezgrupowanych wzór na wariancję omówiono poniżej:
- Przykładowy wzór na wariancję dla niezgrupowanych danych (P 2 ) = ∑ (x I - X) 2 /(n-1)
- Wzór na wariancję populacji dla danych niezgrupowanych (P 2 ) = ∑ (x I - X) 2 /N
Gdzie X jest średnią zgrupowanych danych
Wzór na obliczanie wariancji
Wzór używany do obliczania wariancji omówiono na poniższym obrazku,

Jak obliczyć wariancję?
Ogólnie rzecz biorąc, wariancja oznacza wariancję standardową populacji. Aby obliczyć wariancję danego zestawu wartości, należy wykonać następujące kroki:
Krok 1: Oblicz średnią obserwacji korzystając ze wzoru (Średnia = Suma obserwacji/Liczba obserwacji)
Krok 2: Oblicz kwadraty różnic wartości danych ze średniej. (Wartość danych – średnia)2
Krok 3: Oblicz średnią kwadratów różnic podanych wartości, które nazywamy wariancją zbioru danych.
(Wariancja = suma kwadratów różnic / liczba obserwacji)
Wariancja i odchylenie standardowe
Wariancja i Odchylenie standardowe obie są miarami tendencji centralnej, która służy do poinformowania nas o stopniu, w jakim wartości zbioru danych odbiegają od wartości centralnej lub średniej zbioru danych.
Istnieje wyraźna zależność pomiędzy wariancją a odchyleniem standardowym dla dowolnego zbioru danych.
Wariancja = (odchylenie standardowe) 2
Wariancję definiuje się jako kwadrat odchylenia standardowego, tj. kwadrat odchylenia standardowego dla dowolnej grupy danych daje nam wariancję tego zbioru danych. wariancję definiuje się za pomocą symbolu P 2 mając na uwadze, że P służy do definiowania odchylenia standardowego zbioru danych. Wariancję zbioru danych wyraża się w jednostkach kwadratowych, natomiast odchylenie standardowe zbioru danych wyraża się w jednostce podobnej do średniej zbioru danych.
Ucz się więcej: Wariancja i odchylenie standardowe
Wariancja rozkładu dwumianowego
Rozkład dwumianowy jest dyskretnym rozkładem prawdopodobieństwa, który informuje nas o liczbie pozytywnych wyników w eksperymencie dwumianowym przeprowadzonym n razy. Wynikiem eksperymentu dwumianowego jest 0 lub 1, czyli dodatni lub ujemny.
W eksperymencie dwumianowym N prób i gdzie podane jest prawdopodobieństwo każdej próby P , następnie wariancję rozkładu dwumianowego podaje się za pomocą,
P 2 = np (1 – p)
Gdzie ‘np’ definiuje się jako średnią wartości rozkładu dwumianowego.
Wariancja rozkładu Poissona
Dystrybucja trucizn definiuje się jako dyskretny rozkład prawdopodobieństwa używany do określenia prawdopodobieństwa wystąpienia „n” zdarzeń w okresie „x”. Średnią w rozkładzie Poissona określa symbol l.
W rozkładzie Poissona średnia i wariancja danego zbioru danych są równe. Wariancję rozkładu Poissona podaje się za pomocą wzoru:
P 2 = λ
Wariancja rozkładu równomiernego
W rozkładzie jednorodnym dane dotyczące rozkładu prawdopodobieństwa są ciągłe. Wynik tych eksperymentów mieści się w zakresie pomiędzy określoną górną i dolną granicą, dlatego też rozkłady te nazywane są również rozkładami prostokątnymi. Jeśli górna granica lub maksymalna granica wynosi B a dolna granica lub minimalna granica to a, wówczas wariancję rozkładu równomiernego oblicza się za pomocą wzoru:
P 2 = (1/12)(b – a) 2
Średnią rozkładu równomiernego podaje się za pomocą wzoru,
Średnia = (b + a) / 2
Gdzie,
- B jest górną granicą rozkładu równomiernego
- A jest dolną granicą rozkładu równomiernego
Wariancja i kowariancja
Wariancja zbioru danych określa zmienność wszystkich wartości zbioru danych w odniesieniu do średniej wartości zbioru danych. Kowariancja mówi nam, w jaki sposób zmienne losowe są ze sobą powiązane i mówi nam, jak zmiana jednej zmiennej wpływa na zmianę innych zmiennych.
Kowariancja może być dodatnia lub ujemna, dodatnia kowariancja oznacza, że obie zmienne poruszają się w tym samym kierunku w odniesieniu do wartości średniej, natomiast ujemna kowariancja oznacza, że obie zmienne poruszają się w przeciwnych kierunkach względem wartości średniej.
Dla dwóch zmiennych losowych x i y, gdzie x jest zmienną zależną, a y jest zmienną niezależną, kowariancję oblicza się za pomocą wzoru przedstawionego na załączonym obrazku poniżej.

Właściwości wariancji
Wariancja jest szeroko stosowana w matematyce, statystyce i innych gałęziach nauki do różnych celów. Wariancja ma różne właściwości, które są szeroko stosowane do rozwiązywania różnych problemów. Niektóre z podstawowych właściwości wariancji to:
- Wariancja zbioru danych jest wielkością nieujemną, a zerowa wartość wariancji oznacza, że wszystkie wartości zbioru danych są równe.
- Większa wartość wariancji mówi nam, że wszystkie wartości danych w zbiorze danych są bardzo rozproszone, tj. są daleko od średniej wartości zbioru danych.
- Niższa wartość wariancji mówi nam, że wszystkie wartości danych w zbiorze danych są blisko siebie, tj. są bardzo blisko średniej wartości zbioru danych.
Dla dowolnego stałego „c”
klasa abstrakcyjna w Javie
- Var(x + c) = Var(x)
Gdzie X jest zmienną losową
- Var(cx) = c2
Gdzie X jest zmienną losową
Także jeśli A I B są wartością stałą i X jest zatem zmienną losową,
- Var(ax + b) = a2
Dla zmiennych niezależnych x1, X2, X3…,XNwiemy to,
- Gdzie (x1+ x2+……+ xN) = Var(x1) + Gdzie(x2) +……..+Gdzie(xN)
Ludzie czytali także:
- Mieć na myśli
- Tryb
- Różnica między wariancją a odchyleniem standardowym
Przykłady dotyczące wzoru na wariancję
Przykład 1: Oblicz wariancję przykładowych danych: 7, 11, 15, 19, 24.
Rozwiązanie:
Mamy dane 7, 11, 15, 19, 24
Znajdź średnią danych.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Korzystając ze wzoru na wariancję otrzymujemy,
P2= ∑ (xI- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Przykład 2: Oblicz liczbę obserwacji, jeśli wariancja danych wynosi 12, a suma kwadratów różnic danych od średniej wynosi 156.
Rozwiązanie:
Mamy,
(XI- X)2= 156
P2= 12
Korzystając ze wzoru na wariancję otrzymujemy,
P2= ∑ (xI- X)2/N
12 = 156/n
n = 156/12
n = 13
Przykład 3: Oblicz wariancję dla podanych danych
| XI | FI |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Rozwiązanie:
Średnia (x̄) = ∑(fIXI)/∑(fI)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fI) = 1+3+5+1 = 10
XI
FI
FIXI
(XI- X)
(XI- X)2
FI(XI- X)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Teraz,
P 2 = (∑ I N F I (X I - X) 2 /N)
= [(16 + 12 + 0 +8)/10]
= 3,6Wariancja (σ2) = 3,6
Przykład 4: Znajdź wariancję poniższej tabeli danych
| Klasa | Częstotliwość |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Rozwiązanie:
Klasa
Xi
FI
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
piętnaście
-piętnaście
225
675
10-20
piętnaście
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
2
70
piętnaście
225
450
40-50
Cztery pięć
1
Cztery pięć
25
625
625
Całkowity
16
320
2000
Średnia (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20P 2 = (∑ I N F I (X I - M) 2 /N)
= [(2000)/(16)]
= (125)Wariancja danego zbioru danych wynosi 125.
Podsumowanie – wariancja
Wariancja to miara statystyczna pokazująca, jak bardzo wartości w zbiorze danych różnią się od średniej. Pomaga nam zrozumieć rozproszenie lub rozproszenie punktów danych. Istnieją dwa główne typy wariancji: wariancja populacji, która mierzy, jak rozłożone są punkty danych w całej populacji, oraz wariancja próbki, która mierzy, jak rozłożone są punkty danych w próbie. Wariancja jest oznaczana przez σ² i jest kwadratem odchylenia standardowego. Aby obliczyć wariancję, znajdź średnią danych, odejmij średnią od każdego punktu danych, podnieś różnice do kwadratu, a następnie uśrednij te kwadraty różnic. Wariancja jest ważna, ponieważ pomaga nam zrozumieć zmienność w zbiorze danych. Wysoka wariancja wskazuje, że punkty danych są szeroko rozłożone, natomiast niska wariancja wskazuje, że są one zbliżone do średniej. Wariancja jest zawsze nieujemna, ponieważ polega na podniesieniu różnic do kwadratu.
Często zadawane pytania dotyczące wariancji
Czym jest wariancja w statystyce?
Wariancję definiuje się jako rozrzut wartości zbioru danych w stosunku do średniej wartości zbioru danych. Wariancja zbioru danych informuje o stopniu, w jakim wartości w konkretnym zbiorze danych różnią się od wartości średniej.
Jaki jest symbol wariancji?
Używamy symboli σ2, s2 i Var(x) oznaczające wariancję zbioru danych.
Jaki jest wzór na wariancję?
Wariancję zbioru danych oblicza się za pomocą wzoru:
P 2 = E[( X – m ) 2 ]
Co mówi wariancja?
Wariancja służy do znalezienia zakresu rozproszenia danych, tj. mówi nam, jak wartości w zbiorze danych są rozłożone w odniesieniu do wartości średniej. Dla większej wartości wariancji wartości są szeroko rozłożone względem wartości średniej, natomiast dla mniejszej wartości wariancji wartości są blisko rozłożone względem wartości średniej
Jaki jest związek między wariancją a odchyleniem standardowym?
Dla danego zbioru danych wariancja zbioru danych jest kwadratem odchylenia standardowego tego zbioru danych. Zależność tę wyraża się wzorem:
Wariancja = (odchylenie standardowe) 2
Jak obliczyć wariancję?
Aby obliczyć wariancję, najpierw należy znaleźć średnią (średnią) zbioru danych. Następnie odejmij średnią od każdego punktu danych i podnieś wynik do kwadratu. Na koniec uśrednij te kwadraty różnic.
klasa obiektu w Javie
Dlaczego wariancja jest ważna?
Wariancja ma kluczowe znaczenie dla zrozumienia rozkładu danych w zbiorze danych. Pomaga w określeniu odległości punktów danych od wartości średniej, wskazując zmienność lub spójność danych.
Jaka jest różnica między wariancją a odchyleniem standardowym?
Chociaż zarówno wariancja, jak i odchylenie standardowe mierzą rozproszenie danych, odchylenie standardowe jest pierwiastkiem kwadratowym wariancji. Odchylenie standardowe wyraża się w tych samych jednostkach, co dane, co ułatwia interpretację w celu wskazania rozrzutu.
Czy wariancja może być ujemna?
Nie, wariancja nie może być ujemna. Ponieważ oblicza się ją jako średnią kwadratów różnic od średniej, wynikowa wartość jest zawsze nieujemna.