logo

Dane nominalne i porządkowe

Nauka o danych koncentruje się na przetwarzaniu i analizie danych przy użyciu szeregu narzędzi i technik. W dzisiejszym świecie opartym na danych napotykamy typy danych, z których każdy wymaga obsługi i interpretacji. Aby dokonać właściwej analizy danych i interpretacji statystycznej, ważne jest zrozumienie różnych typów danych. Rodzaj danych determinuje właściwe metody statystyczne i operacje, które należy zastosować. Różne typy danych wymagają różnych metod analizy i interpretacji, aby wyciągnąć istotne wnioski. W tym artykule omówimy koncepcję danych i ich znaczenie, podając przykłady z życia codziennego i poprowadzimy Cię przez sposoby pracy z nimi.

Poziomy pomiaru

Przed przystąpieniem do analizy zbioru danych istotne jest określenie rodzaju danych, jakie on zawiera. Na szczęście wszystkie dane można pogrupować w jedną z czterech kategorii: dane nominalne, porządkowe, przedziałowe lub ilorazowe. Chociaż często określa się je jako typy danych, w rzeczywistości są to różne poziomy pomiaru. Poziom pomiaru odzwierciedla dokładność, z jaką zmienna została skwantyfikowana, i określa metody, które można zastosować do wyciągnięcia wniosków z danych.



Cztery kategorie danych nie zawsze są łatwe do rozróżnienia i zamiast tego należą do hierarchii, w której każdy poziom opiera się na poprzednim.

1

Istnieją cztery rodzaje danych: kategoryczne, które można dalej podzielić na nominalne i porządkowe oraz numeryczne, które można dalej podzielić na przedziały i iloraz. Skale nominalne i porządkowe są stosunkowo nieprecyzyjne, co ułatwia ich analizę, ale dają mniej dokładne spostrzeżenia. Z drugiej strony skale przedziałowe i ilorazowe są bardziej złożone i trudne do analizy, ale mogą zapewnić znacznie bogatsze spostrzeżenia.



  • Dane nominalne – Dane nominalne to podstawowy typ danych, który kategoryzuje dane poprzez etykietowanie lub nazywanie wartości, takich jak płeć, kolor włosów lub typ zwierzęcia. Nie ma żadnej hierarchii.
  • Dane porządkowe – Dane porządkowe obejmują klasyfikację danych na podstawie rangi, np. statusu społecznego, w kategoriach takich jak „bogaci”, „średnie dochody” lub „biedni”. Nie ma jednak ustalonych odstępów pomiędzy tymi kategoriami.
  • Dane interwałowe – Dane interwałowe to sposób organizowania i porównywania danych obejmujących zmierzone interwały. Skale temperatur, takie jak stopnie Celsjusza czy Fahrenheita, są dobrymi przykładami danych interwałowych. Jednak dane przedziałowe nie mają prawdziwego zera, co oznacza, że ​​pomiar zera może nadal reprezentować miarę wymierną (np. zero stopni Celsjusza, które jest tylko kolejnym punktem na skali i w rzeczywistości nie oznacza, że ​​nie ma temperatury). .
  • Dane współczynnika – Najbardziej skomplikowanym poziomem pomiaru są dane ilorazowe. Podobnie jak dane interwałowe, kategoryzuje i porządkuje dane, wykorzystując zmierzone interwały. Jednak w przeciwieństwie do danych interwałowych, dane ilorazowe zawierają rzeczywiste zero. Gdy zmienna ma wartość zero, nie ma tej zmiennej. Doskonałą ilustracją danych dotyczących proporcji jest pomiar wzrostu, który nie może być ujemny.

Co to są dane nominalne?

Dane kategoryczne, zwane również danymi nominalnymi, to kluczowy rodzaj informacji wykorzystywanych w różnych dziedzinach, takich jak badania, statystyka i analiza danych. Zawiera kategorie lub etykiety, które pomagają w klasyfikowaniu i porządkowaniu danych. Zasadniczą cechą danych kategorycznych jest to, że nie posiadają one żadnego nieodłącznego porządku ani rankingu wśród swoich kategorii. Zamiast tego kategorie te są odrębne, odrębne i wzajemnie się wykluczają.

2

Na przykład dane nominalne służą do klasyfikowania informacji w odrębne etykiety lub kategorie bez żadnego naturalnego porządku ani rankingu. Te etykiety lub kategorie są reprezentowane za pomocą nazw lub terminów i nie ma między nimi naturalnego porządku ani rankingu. Dane nominalne są przydatne do jakościowej klasyfikacji i organizacji informacji, umożliwiając badaczom i analitykom grupowanie punktów danych w oparciu o określone atrybuty lub cechy bez sugerowania jakichkolwiek relacji liczbowych.



  • Kategorie kolorów oczu, takie jak niebieski lub zielony, reprezentują dane nominalne. Każda kategoria jest odrębna, bez kolejności i rankingu.
  • Marki smartfonów, takie jak iPhone czy Samsung, to dane nominalne. Nie ma hierarchii wśród marek.
  • Rodzaje transportu, takie jak samochód czy rower, to dane nominalne. Są to odrębne kategorie, pozbawione wewnętrznego porządku.

Charakterystyka danych nominalnych

  • Dane sklasyfikowane jako nominalne składają się z kategorii, które są całkowicie odrębne i odrębne od siebie.
  • Dane należące do kategorii nominalnej wyróżniają się etykietami opisowymi, a nie jakąkolwiek wartością liczbową lub ilościową
  • Danych nominalnych nie można uszeregować ani uporządkować hierarchicznie, ponieważ żadna kategoria nie jest lepsza ani gorsza od innej.

Przykład

Oto kilka przykładów wykorzystania danych nominalnych do klasyfikowania i kategoryzowania informacji w odrębne i nieuporządkowane kategorie:

1. Kolory samochodu: Kolory samochodów to dane nominalne, z jasnymi kategoriami, ale bez nieodłącznej kolejności czy rankingu. Każdy samochód należy do jednej kategorii kolorystycznej, bez żadnego logicznego lub numerycznego powiązania pomiędzy kolorami.

2. Rodzaje owoców: Kategorie owoców w koszyku są nominalne. Każdy owoc należy do określonej kategorii, bez hierarchii i porządku. Wszystkie kategorie są odrębne i dyskretne.

3. Gatunki filmowe: Gatunki filmów to dane nominalne, ponieważ nie ma rankingu między kategoriami takimi jak akcja czy komedia. Każdy gatunek jest wyjątkowy, ale na podstawie samych danych nie możemy stwierdzić, czy jeden jest lepszy od drugiego.

Co to są dane porządkowe?

Dane porządkowe to forma danych jakościowych, która klasyfikuje zmienne w kategorie opisowe. Charakteryzuje się tym, że kategorie, którymi się posługuje, są uszeregowane w jakiejś hierarchicznej skali, na przykład od najwyższej do najniższej. Dane porządkowe to drugi po danych nominalnych najbardziej skomplikowany rodzaj pomiaru. Chociaż jest to bardziej skomplikowane niż dane nominalne, którym brakuje wewnętrznego porządku, nadal jest stosunkowo uproszczone.

3

Na przykład dane porządkowe to typ danych używany do kategoryzowania elementów za pomocą znaczącej hierarchii lub porządku. Kategorie te pomagają nam porównywać i oceniać różne osiągnięcia, pozycje lub wyniki uczniów, nawet jeśli odstępy między nimi nie są równe. Dane porządkowe są przydatne do zrozumienia uporządkowanych wyborów lub preferencji oraz do oceny względnych różnic.

  • Oceny szkolne: Oceny takie jak A, B, C to dane porządkowe, uszeregowane według osiągnięć, ale odstępy między nimi są różne.
  • Poziom wykształcenia: Poziomy takie jak szkoła średnia, licencjat, magister to dane porządkowe, uporządkowane według wykształcenia, ale różnice między poziomami są różne.
  • Poziom stażu pracy: Poziomy stanowisk, takie jak podstawowy, średni, starszy, to dane porządkowe, wskazujące hierarchię, ale różnica różni się w zależności od stanowiska i branży.

Charakterystyka danych porządkowych

  • Dane porządkowe należą do kategorii danych nienumerycznych i kategorycznych, ale nadal mogą wykorzystywać wartości liczbowe jako etykiety.
  • Dane porządkowe są zawsze uszeregowane w hierarchii (stąd nazwa „porządkowe”).
  • Dane porządkowe mogą być uszeregowane, ale ich wartości nie są równomiernie rozłożone.
  • Za pomocą danych porządkowych można obliczyć rozkład częstotliwości, modę, medianę i zakres zmiennych.

Przykład

Oto kilka przykładów wykorzystania danych porządkowych w polach i domenach:

1. Poziomy edukacyjne: Dane porządkowe są powszechnie używane do reprezentowania poziomów wykształcenia, takich jak szkoła, tytuł licencjata, magistra i doktora. Poziomy te mają porządek.

2. Oceny zadowolenia klientów: Innym zastosowaniem danych są badania satysfakcji klientów. W ankietach tych często pyta się respondentów o ocenę swoich doświadczeń w skali od słabej do doskonałej.

3. Zajęcia ekonomiczne: klasy, w tym klasa średnia i klasa wyższa, można sklasyfikować jako dane porządkowe na podstawie ich rankingu.

Te przykłady pokazują, w jaki sposób dane porządkowe są wykorzystywane w różnych polach i domenach.

Dane nominalne a zwykłe

Charakterystyka

Dane nominalne

Dane porządkowe

Natura kategorii

Wyraźny i dyskretny

Dyskretny i wyrazisty

Zamówienie/ranking

Żadnego wewnętrznego porządku

Ma jasną kolejność lub ranking

Wartości numeryczne

Brak znaczących wartości liczbowych

Brak znaczących wartości liczbowych

Techniki analizy

Liczniki częstotliwości, wartości procentowe, wykresy słupkowe

Ranking, mediana, testy nieparametryczne, uporządkowane wykresy słupkowe, regresja porządkowa

Przykład

Kolory, płeć, rodzaje zwierząt

lista sortowania Java

Oceny szkolne, poziom wykształcenia, staż pracy

Interpretacja

Służy do klasyfikacji i grupowania na podstawie kategorii

Służy do oceny uporządkowanych preferencji, hierarchii lub rankingów