Uczenie się nadzorowane to rodzaje uczenia maszynowego, w ramach którego maszyny są szkolone przy użyciu dobrze „oznaczonych” danych szkoleniowych i na podstawie tych danych maszyny przewidują wyniki. Oznaczone dane oznaczają, że niektóre dane wejściowe są już oznaczone prawidłowymi danymi wyjściowymi.
W uczeniu nadzorowanym dane szkoleniowe dostarczane maszynom pełnią rolę nadzorcy, który uczy maszyny prawidłowego przewidywania wyników. Stosuje tę samą koncepcję, której uczeń uczy się pod okiem nauczyciela.
Uczenie nadzorowane to proces dostarczania danych wejściowych, a także prawidłowych danych wyjściowych do modelu uczenia maszynowego. Celem algorytmu uczenia się nadzorowanego jest znajdź funkcję mapującą, która mapuje zmienną wejściową (x) na zmienną wyjściową (y) .
W świecie rzeczywistym można wykorzystać uczenie się pod nadzorem Ocena ryzyka, klasyfikacja obrazu, wykrywanie oszustw, filtrowanie spamu itp.
Jak działa nauka nadzorowana?
W uczeniu nadzorowanym modele są szkolone przy użyciu oznakowanego zbioru danych, w którym model uczy się o każdym typie danych. Po zakończeniu procesu uczenia model jest testowany na podstawie danych testowych (podzbioru zbioru uczącego), a następnie przewiduje wynik.
Działanie uczenia się nadzorowanego można łatwo zrozumieć na podstawie poniższego przykładu i diagramu:
javafx
Załóżmy, że mamy zbiór danych składający się z różnych typów kształtów, w tym kwadratu, prostokąta, trójkąta i wielokąta. Teraz pierwszym krokiem jest wytrenowanie modelu dla każdego kształtu.
- Jeżeli dany kształt ma cztery boki i wszystkie boki są równe, to będzie on oznaczony jako a Kwadrat .
- Jeżeli dany kształt ma trzy boki, to będzie oznaczony jako a trójkąt .
- Jeśli dany kształt ma sześć równych boków, zostanie oznaczony jako sześciokąt .
Teraz po treningu testujemy nasz model za pomocą zbioru testowego, a zadaniem modelu jest identyfikacja kształtu.
Maszyna jest już przeszkolona we wszystkich typach kształtów, a kiedy znajdzie nowy kształt, klasyfikuje go na podstawie liczby boków i przewiduje wynik.
Etapy uczenia się pod nadzorem:
- Najpierw określ typ zbioru danych szkoleniowych
- Zbierz/Zbierz oznaczone dane szkoleniowe.
- Podziel zestaw danych szkoleniowych na szkolenia zbiór danych, zbiór danych testowych i zbiór danych walidacyjnych .
- Określ cechy wejściowe zbioru danych szkoleniowych, które powinny posiadać wystarczającą wiedzę, aby model mógł dokładnie przewidzieć dane wyjściowe.
- Określ odpowiedni algorytm dla modelu, taki jak maszyna wektorów nośnych, drzewo decyzyjne itp.
- Wykonaj algorytm na zbiorze danych szkoleniowych. Czasami potrzebujemy zestawów walidacyjnych jako parametrów kontrolnych, które stanowią podzbiór zbiorów danych szkoleniowych.
- Oceń dokładność modelu, udostępniając zbiór testowy. Jeśli model przewiduje prawidłowy wynik, co oznacza, że nasz model jest dokładny.
Rodzaje nadzorowanych algorytmów uczenia maszynowego:
Uczenie się nadzorowane można dalej podzielić na dwa typy problemów:
1. Regresja
Algorytmy regresji są stosowane, jeśli istnieje związek między zmienną wejściową a zmienną wyjściową. Służy do przewidywania zmiennych ciągłych, takich jak prognozowanie pogody, trendy rynkowe itp. Poniżej znajduje się kilka popularnych algorytmów regresji objętych uczeniem nadzorowanym:
klapka
- Regresja liniowa
- Drzewa regresji
- Regresja nieliniowa
- Bayesowska regresja liniowa
- Regresja wielomianowa
2. Klasyfikacja
Algorytmy klasyfikacji są stosowane, gdy zmienna wyjściowa jest jakościowa, co oznacza, że istnieją dwie klasy, takie jak Tak-Nie, Mężczyzna-Kobieta, Prawda-fałsz itp.
Filtrowanie spamu,
- Losowy las
- Drzewa decyzyjne
- Regresja logistyczna
- Maszyny wektorów wsparcia
Uwaga: algorytmy omówimy szczegółowo w późniejszych rozdziałach.
Zalety uczenia się pod nadzorem:
- Dzięki uczeniu się pod nadzorem model może przewidzieć wyniki na podstawie wcześniejszych doświadczeń.
- W uczeniu nadzorowanym możemy mieć dokładne pojęcie o klasach obiektów.
- Model uczenia się nadzorowanego pomaga nam rozwiązywać różne problemy świata rzeczywistego, takie jak wykrywanie oszustw, filtrowanie spamu itp.
Wady uczenia się pod nadzorem:
- Modele uczenia się pod nadzorem nie nadają się do radzenia sobie ze złożonymi zadaniami.
- Uczenie nadzorowane nie może przewidzieć poprawnych wyników, jeśli dane testowe różnią się od zbioru danych szkoleniowych.
- Szkolenie wymagało dużej liczby obliczeń.
- W uczeniu nadzorowanym potrzebujemy wystarczającej wiedzy o klasach obiektów.