logo

Regresja a klasyfikacja w uczeniu maszynowym

Algorytmy regresji i klasyfikacji to algorytmy uczenia się nadzorowanego. Obydwa algorytmy służą do przewidywania w uczeniu maszynowym i współpracują z oznaczonymi zbiorami danych. Różnica między obydwoma polega na tym, jak są one wykorzystywane do różnych problemów związanych z uczeniem maszynowym.

Główna różnica między algorytmami regresji i klasyfikacji, do której wykorzystywane są algorytmy regresji przewidzieć ciągłość wartości takie jak cena, wynagrodzenie, wiek itp. oraz algorytmy klasyfikacji przewidzieć/klasyfikować wartości dyskretne takie jak mężczyzna czy kobieta, prawda czy fałsz, spam czy nie spam itp.

Rozważ poniższy diagram:

Regresja a klasyfikacja

Klasyfikacja:

Klasyfikacja to proces znajdowania funkcji, która pomaga w podzieleniu zbioru danych na klasy w oparciu o różne parametry. W klasyfikacji program komputerowy jest szkolony na zbiorze danych szkoleniowych i na podstawie tego szkolenia kategoryzuje dane na różne klasy.

Zadaniem algorytmu klasyfikacji jest znalezienie funkcji mapującej, która mapuje wejście (x) na dyskretne wyjście (y).

Przykład: Najlepszym przykładem zrozumienia problemu klasyfikacji jest wykrywanie spamu w wiadomościach e-mail. Model jest szkolony na podstawie milionów e-maili pod kątem różnych parametrów i za każdym razem, gdy otrzymuje nowy e-mail, identyfikuje, czy jest on spamem, czy nie. Jeśli wiadomość e-mail jest spamem, jest przenoszona do folderu Spam.

Rodzaje algorytmów klasyfikacji ML:

Algorytmy klasyfikacyjne można dalej podzielić na następujące typy:

  • Regresja logistyczna
  • K-Najbliżsi sąsiedzi
  • Wsparcie maszyn wektorowych
  • Jądro SVM
  • Naiwny Bayes
  • Klasyfikacja drzewa decyzyjnego
  • Klasyfikacja losowego lasu

Regresja:

Regresja to proces znajdowania korelacji między zmiennymi zależnymi i niezależnymi. Pomaga w przewidywaniu zmiennych ciągłych, takich jak przewidywanie Trendy marketowe , przewidywanie cen domów itp.

Zadaniem algorytmu regresji jest znalezienie funkcji mapującej, która mapuje zmienną wejściową (x) na ciągłą zmienną wyjściową (y).

Przykład: Załóżmy, że chcemy prognozować pogodę, więc w tym celu użyjemy algorytmu regresji. W przypadku przewidywania pogody model jest szkolony na danych z przeszłości, a po zakończeniu uczenia może z łatwością przewidzieć pogodę na przyszłe dni.

Rodzaje algorytmów regresji:

  • Prosta regresja liniowa
  • Wielokrotna regresja liniowa
  • Regresja wielomianowa
  • Regresja wektora pomocniczego
  • Regresja drzewa decyzyjnego
  • Losowa regresja lasu

Różnica między regresją a klasyfikacją

Algorytm regresji Algorytm klasyfikacji
W regresji zmienna wyjściowa musi mieć charakter ciągły lub wartość rzeczywistą. W klasyfikacji zmienna wyjściowa musi być wartością dyskretną.
Zadaniem algorytmu regresji jest odwzorowanie wartości wejściowej (x) na ciągłą zmienną wyjściową (y). Zadaniem algorytmu klasyfikacji jest odwzorowanie wartości wejściowej (x) na dyskretną zmienną wyjściową (y).
Algorytmy regresji są stosowane w przypadku danych ciągłych. Algorytmy klasyfikacji są używane z danymi dyskretnymi.
W regresji staramy się znaleźć najlepszą linię dopasowania, która pozwala dokładniej przewidzieć wynik. W Klasyfikacji staramy się znaleźć granicę decyzyjną, która może podzielić zbiór danych na różne klasy.
Algorytmy regresji można wykorzystać do rozwiązywania problemów regresyjnych, takich jak prognozowanie pogody, przewidywanie cen domów itp. Algorytmy klasyfikacji można wykorzystać do rozwiązywania problemów z klasyfikacją, takich jak identyfikacja wiadomości spamowych, rozpoznawanie mowy, identyfikacja komórek nowotworowych itp.
Algorytm regresji można dalej podzielić na regresję liniową i nieliniową. Algorytmy klasyfikacji można podzielić na klasyfikator binarny i klasyfikator wieloklasowy.