logo

Zrozumienie testowania hipotez

Testowanie hipotez polega na formułowaniu założeń dotyczących parametrów populacji w oparciu o statystyki próby i rygorystycznej ocenie tych założeń w oparciu o dowody empiryczne. Artykuł ten rzuca światło na znaczenie testowania hipotez i najważniejszych etapów tego procesu.

Co to jest testowanie hipotez?

Testowanie hipotez to metoda statystyczna służąca do podejmowania decyzji statystycznych na podstawie danych eksperymentalnych. Testowanie hipotez to w zasadzie założenie, które przyjmujemy na temat parametru populacji. Ocenia dwa wzajemnie wykluczające się stwierdzenia dotyczące populacji, aby określić, które stwierdzenie jest najlepiej poparte przykładowymi danymi.



Przykład: Mówisz, że średni wzrost w klasie to 30 lat lub że chłopak jest wyższy od dziewczynki. Wszystko to jest założeniem, które zakładamy i potrzebujemy jakiegoś statystycznego sposobu, aby to udowodnić. Potrzebujemy jakichś matematycznych wniosków, niezależnie od tego, co zakładamy, że jest prawdą.

Definiowanie hipotez

  • Hipoteza zerowa (H 0 ): W statystyce hipoteza zerowa jest ogólnym stwierdzeniem lub stanowiskiem domyślnym, że nie ma związku między dwoma mierzonymi przypadkami lub nie ma związku między grupami. Inaczej mówiąc, jest to założenie podstawowe lub przyjęte na podstawie wiedzy o problemie.
    Przykład : Średnia produkcja firmy wynosi 50 jednostek na dzień H0: mu= 50.
  • Hipoteza alternatywna (H 1 ): Hipoteza alternatywna to hipoteza używana do testowania hipotez, która jest sprzeczna z hipotezą zerową.
    Przykład: Produkcja firmy nie jest równa 50 sztuk dziennie, tj. H1: mu N pięćdziesiąt.

Kluczowe warunki testowania hipotez

  • Poziom istotności : Odnosi się do stopnia istotności, w jakim akceptujemy lub odrzucamy hipotezę zerową. Przyjęcie hipotezy nie pozwala na 100% dokładność, dlatego wybieramy poziom istotności, który zwykle wynosi 5%. Zwykle jest to oznaczone przez alfai ogólnie jest to 0,05 lub 5%, co oznacza, że ​​wynik powinien być pewny na 95%, aby dać podobny wynik w każdej próbce.
  • Wartość P: The Wartość P lub obliczone prawdopodobieństwo to prawdopodobieństwo znalezienia zaobserwowanych/ekstremalnych wyników, gdy hipoteza zerowa (H0) problemu będącego przedmiotem badania jest prawdziwa. Jeśli Twoja wartość P jest mniejsza niż wybrany poziom istotności, odrzucasz hipotezę zerową, tj. akceptujesz, że Twoja próbka twierdzi, że potwierdza hipotezę alternatywną.
  • Statystyka testowa: Statystyka testowa to wartość liczbowa obliczona na podstawie przykładowych danych podczas testowania hipotezy, używana do określenia, czy odrzucić hipotezę zerową. Porównuje się ją z wartością krytyczną lub wartością p, aby podjąć decyzję o statystycznym znaczeniu obserwowanych wyników.
  • Krytyczna wartość : Wartość krytyczna w statystyce to próg lub punkt odcięcia używany do ustalenia, czy odrzucić hipotezę zerową w teście hipotezy.
  • Stopnie swobody: Stopnie swobody są powiązane ze zmiennością lub swobodą szacowania parametru. Stopnie swobody są związane z wielkością próbki i określają jej kształt.

Dlaczego stosujemy testowanie hipotez?

Testowanie hipotez jest ważną procedurą w statystyce. Testowanie hipotez ocenia dwa wzajemnie wykluczające się stwierdzenia populacyjne, aby określić, które stwierdzenie jest najlepiej poparte przykładowymi danymi. Kiedy mówimy, że wyniki są istotne statystycznie, dzięki testowaniu hipotez.

Test jednostronny i dwustronny

Test jednostronny skupia się na jednym kierunku, większym lub mniejszym od określonej wartości. Testu jednostronnego używamy, gdy istnieją jasne oczekiwania kierunkowe oparte na wcześniejszej wiedzy lub teorii. Obszar krytyczny znajduje się tylko po jednej stronie krzywej rozkładu. Jeżeli próbka mieści się w tym obszarze krytycznym, hipoteza zerowa zostaje odrzucona na rzecz hipotezy alternatywnej.



Test jednostronny

Istnieją dwa rodzaje testów jednostronnych:

  • Test lewostronny (lewostronny): Hipoteza alternatywna zakłada, że ​​prawdziwa wartość parametru jest mniejsza niż hipoteza zerowa. Przykład: H0​: mu geq 50i H1:
  • i H1: mu>50

Test dwustronny

Test dwustronny uwzględnia oba kierunki, większy i mniejszy od określonej wartości. Testu dwustronnego używamy, gdy nie ma określonych oczekiwań kierunkowych i chcemy wykryć jakąkolwiek znaczącą różnicę.

Przykład: H0: w =50 i H1: mu 
eq 50



Czym są błędy typu 1 i typu 2 w testowaniu hipotez?

W testowaniu hipotez Błędy typu I i typu II to dwa możliwe błędy, które badacze mogą popełnić przy wyciąganiu wniosków na temat populacji na podstawie próbki danych. Błędy te są związane z decyzjami podjętymi w odniesieniu do hipotezy zerowej i hipotezy alternatywnej.

  • Błąd typu I: Kiedy odrzucamy hipotezę zerową, mimo że hipoteza ta była prawdziwa. Błąd typu I oznacza się alfa( alfa).
  • Błędy typu II: Kiedy przyjmujemy hipotezę zerową, ale jest ona fałszywa. Błędy typu II są oznaczone symbolem beta( eta).


Hipoteza zerowa jest prawdziwa

Hipoteza zerowa jest fałszywa

Hipoteza zerowa jest prawdziwa (zaakceptuj)

Właściwa decyzja

Błąd typu II (fałszywie ujemny)

Alternatywna hipoteza jest prawdziwa (odrzuć)

Błąd typu I (fałszywie dodatni)

Właściwa decyzja

Jak działa testowanie hipotez?

Krok 1: Zdefiniuj hipotezę zerową i alternatywną

Podaj hipotezę zerową ( H_0), co oznacza brak efektu, oraz hipoteza alternatywna ( H_1​), sugerując efekt lub różnicę.

Najpierw identyfikujemy problem, o którym chcemy przyjąć założenia, pamiętając, że nasze założenia powinny być ze sobą sprzeczne, zakładając Dane o rozkładzie normalnym.

Krok 2 – Wybierz poziom istotności

Wybierz poziom istotności ( alfa), zwykle 0,05, aby określić próg odrzucenia hipotezy zerowej. Zapewnia ważność naszego testu hipotez, zapewniając, że mamy wystarczające dane na poparcie naszych twierdzeń. Zazwyczaj poziom istotności określamy przed testem. The wartość p jest kryterium stosowanym do obliczenia naszej wartości istotności.

Krok 3 Zbieraj i analizuj dane.

Zbierz odpowiednie dane poprzez obserwację lub eksperymenty. Analizuj dane, stosując odpowiednie metody statystyczne, aby uzyskać statystykę testową.

Krok 4 – Oblicz statystykę testową

Dane do testów są oceniane na tym etapie, szukamy różnych wyników w oparciu o charakterystykę danych. Wybór statystyki testowej zależy od rodzaju przeprowadzanego testu hipotezy.

Istnieją różne testy hipotez, każdy odpowiedni do innego celu obliczenia naszego testu. To może być Z-test , Chi-kwadrat , Test T , i tak dalej.

  1. Z-test : Jeśli znane są średnie populacji i odchylenia standardowe. Powszechnie stosowana jest statystyka Z.
  2. test t : Jeśli odchylenia standardowe populacji są nieznane. a wielkość próby jest mała niż bardziej odpowiednia jest statystyka testu t.
  3. Test chi-kwadrat : Test chi-kwadrat jest używany do danych kategorycznych lub do testowania niezależności w tabelach kontyngencji
  4. Test F : Test F jest często używany w analizie wariancji (ANOVA) do porównywania wariancji lub testowania równości średnich w wielu grupach.

Mamy mniejszy zbiór danych, więc test T jest bardziej odpowiedni do sprawdzenia naszej hipotezy.

Statystyka T jest miarą różnicy między średnimi z dwóch grup w odniesieniu do zmienności w obrębie każdej grupy. Oblicza się go jako różnicę średnich z próbki podzieloną przez błąd standardowy różnicy. Nazywa się ją również wartością t lub wynikiem t.

losowa liczba Java

Krok 5 – Porównanie statystyki testowej:

Na tym etapie decydujemy, gdzie przyjąć hipotezę zerową lub odrzucić hipotezę zerową. Istnieją dwa sposoby zdecydowania, gdzie powinniśmy zaakceptować lub odrzucić hipotezę zerową.

Metoda A: Używanie wartości krytycznych

Porównując statystykę testową i tabelaryczną wartość krytyczną, którą mamy,

  • Jeśli statystyka testowa>wartość krytyczna: odrzuć hipotezę zerową.
  • Jeśli statystyka testowa ≤Wartość krytyczna: Nie można odrzucić hipotezy zerowej.

Notatka: Wartości krytyczne to z góry określone wartości progowe, które są wykorzystywane do podjęcia decyzji podczas testowania hipotez. Określić wartości krytyczne do testowania hipotez zwykle odwołujemy się do tabeli rozkładu statystycznego, takiej jak rozkład normalny lub tabele rozkładu t, na których podstawie.

Metoda B: Stosowanie wartości P

Możemy również dojść do wniosku, korzystając z wartości p,

  • Jeśli wartość p jest mniejsza lub równa poziomowi istotności, tj. ( p
ównoważnikalfa), odrzucasz hipotezę zerową. Oznacza to, że jest mało prawdopodobne, aby zaobserwowane wyniki wystąpiły wyłącznie przez przypadek, co dostarcza dowodów na korzyść hipotezy alternatywnej.
  • Jeśli wartość p jest większa niż poziom istotności, tj. ( pgeq alfa), nie odrzucisz hipotezy zerowej. Sugeruje to, że zaobserwowane wyniki są zgodne z tym, czego można by się spodziewać na podstawie hipotezy zerowej.

Notatka : Wartość p to prawdopodobieństwo otrzymania statystyki testowej równie ekstremalnej lub bardziej ekstremalnej niż ta obserwowana w próbie, przy założeniu, że hipoteza zerowa jest prawdziwa. Określić wartość p do testowania hipotez zwykle odwołujemy się do tabeli rozkładu statystycznego, takiej jak rozkład normalny lub tabele rozkładu t, na których podstawie.

Krok 7 – Interpretacja wyników

Wreszcie możemy zakończyć nasz eksperyment stosując metodę A lub B.

Obliczanie statystyki testowej

Aby zweryfikować naszą hipotezę dotyczącą parametru populacji, którego używamy funkcje statystyczne . Używamy wyniku z, wartości p i poziomu istotności (alfa), aby udowodnić naszą hipotezę dane o rozkładzie normalnym .

1. Statystyka Z:

Gdy znane są średnie populacji i odchylenia standardowe.

ml na uncje

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

Gdzie,

  • ar{x}jest średnią próbki,
  • μ oznacza średnią populacji,
  • σ jest odchyleniem standardowym
  • oraz n jest wielkością próbki.

2. Statystyka T

Test T stosuje się, gdy n<30,

obliczenie statystyki t wynika ze wzoru:

t=frac{x̄-Μ}{s/sqrt{n}}

Gdzie,

  • t = wynik t,
  • x̄ = średnia próbki
  • μ = średnia populacji,
  • s = odchylenie standardowe próbki,
  • n = wielkość próbki

3. Test chi-kwadrat

Test chi-kwadrat dla danych kategorycznych niezależności (o rozkładzie normalnym) przy użyciu:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

Gdzie,

  • O_{ij}jest częstotliwością obserwowaną w komórce {ij}
  • i,j to odpowiednio indeksy wierszy i kolumn.
  • E_{ij}jest oczekiwaną częstotliwością w komórce {ij}, obliczone jako:
    frac{{	ext{{Suma wierszy}} 	imes 	ext{{Suma kolumn}}}}{{	ext{{Suma obserwacji}}}}

Przykład testowania hipotez z życia wziętego

Przeanalizujmy testowanie hipotez w dwóch rzeczywistych sytuacjach:

Przypadek A: D oes Nowy lek wpływa na ciśnienie krwi?

Wyobraź sobie, że firma farmaceutyczna opracowała nowy lek, który ich zdaniem może skutecznie obniżyć ciśnienie krwi u pacjentów z nadciśnieniem. Przed wprowadzeniem leku na rynek muszą przeprowadzić badanie, aby ocenić jego wpływ na ciśnienie krwi.

Dane:

  • Przed leczeniem: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Po zabiegu: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

Krok 1 : Zdefiniuj hipotezę

  • Hipoteza zerowa : (H0)Nowy lek nie ma wpływu na ciśnienie krwi.
  • Hipoteza alternatywna : (H1)Nowy lek ma wpływ na ciśnienie krwi.

Krok 2: Zdefiniuj poziom istotności

Rozważmy poziom istotności na poziomie 0,05, co oznacza odrzucenie hipotezy zerowej.

Jeśli dowody wskazują, że szansa na obserwację wyników jest mniejsza niż 5% ze względu na zmienność losową.

Krok 3 : Oblicz statystykę testową

Za pomocą sparowany test T analizować dane, aby uzyskać statystykę testową i wartość p.

Statystykę testową (np. statystykę T) oblicza się na podstawie różnic pomiędzy pomiarami ciśnienia krwi przed i po leczeniu.

t = m/(s/√n)

Gdzie:

  • M = średnia różnicy, tj X Po, X zanim
  • S = odchylenie standardowe różnicy (d), tj D I ​= X Po, I X zanim,
  • N = wielkość próbki,

wówczas m= -3,9, s= 1,8 i n= 10

my obliczamy statystykę , T = -9 w oparciu o wzór na test t dla par

Krok 4: Znajdź wartość p

Obliczona statystyka t wynosi -9 i stopnie swobody zm = 9, wartość p można znaleźć za pomocą oprogramowania statystycznego lub tabeli rozkładu t.

zatem wartość p = 8,538051223166285e-06

Krok 5: Wynik

  • Jeśli wartość p jest mniejsza lub równa 0,05, badacze odrzucają hipotezę zerową.
  • Jeśli wartość p jest większa niż 0,05, nie odrzucają hipotezy zerowej.

Wniosek: Ponieważ wartość p (8,538051223166285e-06) jest mniejsza niż poziom istotności (0,05), badacze odrzucają hipotezę zerową. Istnieją istotne statystycznie dowody na to, że średnie ciśnienie krwi przed i po leczeniu nowym lekiem jest różne.

Implementacja testowania hipotez w Pythonie

Stwórzmy testowanie hipotez za pomocą Pythona, gdzie sprawdzamy, czy nowy lek wpływa na ciśnienie krwi. W tym przykładzie użyjemy sparowanego testu T. Skorzystamy z scipy.stats> biblioteka do testu T.

Nasz pierwszy problem z życia wzięty zaimplementujemy za pomocą Pythona,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Wyjście:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

W powyższym przykładzie, biorąc pod uwagę statystykę T wynoszącą około -9 i wyjątkowo małą wartość p, wyniki wskazują na mocny argument za odrzuceniem hipotezy zerowej na poziomie istotności 0,05.

  • Wyniki sugerują, że nowy lek, leczenie lub interwencja ma znaczący wpływ na obniżenie ciśnienia krwi.
  • Ujemna statystyka T wskazuje, że średnie ciśnienie krwi po leczeniu jest znacznie niższe niż zakładana średnia w populacji przed leczeniem.

Sprawa B : Poziom cholesterolu w populacji

Dane: Pobiera się próbkę od 25 osób i mierzy się u nich poziom cholesterolu.

Poziom cholesterolu (mg/dL): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 205, 210, 192, 205, 198, 205, 210, 192, 205.

Struktury danych w Javie

Populacje Średnia = 200

Odchylenie standardowe populacji (σ): 5 mg/dL (podane dla tego problemu)

Krok 1: Zdefiniuj hipotezę

  • Hipoteza zerowa (H 0 ): Średni poziom cholesterolu w populacji wynosi 200 mg/dl.
  • Hipoteza alternatywna (H 1 ): Średni poziom cholesterolu w populacji różni się od 200 mg/dl.

Krok 2: Zdefiniuj poziom istotności

Ponieważ nie jest podany kierunek odchylenia, zakładamy test dwustronny i na podstawie tabeli rozkładu normalnego można obliczyć wartości krytyczne dla poziomu istotności 0,05 (dwustronnego) za pomocą stół z i wynoszą około -1,96 i 1,96.

Krok 3 : Oblicz statystykę testową

Statystykę testową oblicza się za pomocą wzoru z Z = (203,8 - 200) / (5 div sqrt{25})i odpowiednio otrzymujemy, Z =2,03999999999992.

Krok 4: Wynik

Ponieważ wartość bezwzględna statystyki testowej (2,04) jest większa od wartości krytycznej (1,96), hipotezę zerową odrzucamy. I wyciągnij wniosek, że istnieją statystycznie istotne dowody na to, że średni poziom cholesterolu w populacji różni się od 200 mg/dL

Implementacja testowania hipotez w Pythonie

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>max>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Wyjście:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Ograniczenia testowania hipotez

  • Chociaż testowanie hipotez jest użyteczną techniką, nie zapewnia pełnego zrozumienia badanego tematu. Nie oddając w pełni złożoności czy całego kontekstu zjawisk, koncentruje się na pewnych hipotezach i znaczeniu statystycznym.
  • Dokładność wyników testowania hipotez zależy od jakości dostępnych danych i trafności zastosowanych metod statystycznych. Niedokładne dane lub źle sformułowane hipotezy mogą prowadzić do błędnych wniosków.
  • Opieranie się wyłącznie na testowaniu hipotez może spowodować, że analitycy przeoczą znaczące wzorce lub zależności w danych, które nie są ujęte w konkretnych testowanych hipotezach. To ograniczenie podkreśla znaczenie uzupełniania testowania hipotez innymi podejściami analitycznymi.

Wniosek

Testowanie hipotez stanowi kamień węgielny analizy statystycznej, umożliwiając badaczom danych radzenie sobie z niepewnościami i wyciąganie wiarygodnych wniosków z przykładowych danych. Systematycznie definiując hipotezy zerowe i alternatywne, wybierając poziomy istotności i wykorzystując testy statystyczne, badacze mogą ocenić ważność swoich założeń. Artykuł wyjaśnia także zasadnicze rozróżnienie między błędami typu I i typu II, zapewniając wszechstronne zrozumienie zróżnicowanego procesu decyzyjnego nieodłącznie związanego z testowaniem hipotez. Z życia wzięty przykład testowania wpływu nowego leku na ciśnienie krwi za pomocą sparowanego testu T pokazuje praktyczne zastosowanie tych zasad, podkreślając znaczenie rygoru statystycznego w podejmowaniu decyzji w oparciu o dane.

Często zadawane pytania (FAQ)

1. Jakie są 3 rodzaje testów hipotez?

Istnieją trzy rodzaje testów hipotez: prawostronne, lewostronne i dwustronne. Testy prawostronne oceniają, czy parametr jest większy, lewostronne, jeśli mniejszy. Testy dwustronne sprawdzają, czy różnice bezkierunkowe są większe lub mniejsze.

2. Jakie są 4 elementy testowania hipotez?

Hipoteza zerowa ( H_o): Nie ma żadnego efektu ani różnicy.

Alternatywna hipoteza ( H_1): Istnieje efekt lub różnica.

Poziom istotności ( alfa): Ryzyko odrzucenia hipotezy zerowej, gdy jest ona prawdziwa (błąd I rodzaju).

Statystyka testowa: Wartość liczbowa reprezentująca zaobserwowane dowody przeciwko hipotezie zerowej.

3.Co to jest testowanie hipotez w ML?

Metoda statystyczna służąca do oceny wydajności i trafności modeli uczenia maszynowego. Testuje konkretne hipotezy dotyczące zachowania modelu, np. czy cechy wpływają na przewidywania lub czy model dobrze generalizuje na niewidoczne dane.

4. Jaka jest różnica pomiędzy Pytestem a hipotezą w Pythonie?

Pytest służy do ogólnego testowania kodu w języku Python, natomiast Hypothesis jest platformą do testowania opartą na właściwościach dla języka Python, skupiającą się na generowaniu przypadków testowych w oparciu o określone właściwości kodu.