W poprzednim temacie nauczyliśmy się nadzorowanego uczenia maszynowego, w którym modele są szkolone przy użyciu oznakowanych danych pod nadzorem danych uczących. Może się jednak zdarzyć wiele przypadków, w których nie mamy oznaczonych etykietą danych i musimy znaleźć ukryte wzorce z danego zbioru danych. Aby więc rozwiązywać tego typu przypadki w uczeniu maszynowym, potrzebujemy technik uczenia się bez nadzoru.
Co to jest uczenie się bez nadzoru?
Jak sama nazwa wskazuje, uczenie się bez nadzoru to technika uczenia maszynowego, w której modele nie są nadzorowane przy użyciu zbioru danych szkoleniowych. Zamiast tego modele same znajdują ukryte wzorce i spostrzeżenia na podstawie danych. Można to porównać do uczenia się, które odbywa się w ludzkim mózgu podczas uczenia się nowych rzeczy. Można to zdefiniować jako:
znak wodny w słowie
Uczenie się bez nadzoru to rodzaj uczenia maszynowego, w którym modele są szkolone przy użyciu nieoznakowanego zbioru danych i mogą działać na tych danych bez żadnego nadzoru.
Uczenia się bez nadzoru nie można bezpośrednio zastosować do problemu regresji lub klasyfikacji, ponieważ w przeciwieństwie do uczenia się pod nadzorem mamy dane wejściowe, ale nie odpowiadające im dane wyjściowe. Celem uczenia się bez nadzoru jest znajdź podstawową strukturę zbioru danych, pogrupuj dane według podobieństw i przedstaw ten zbiór danych w skompresowanym formacie .
Przykład: Załóżmy, że algorytm uczenia się bez nadzoru otrzymuje wejściowy zbiór danych zawierający obrazy różnych typów kotów i psów. Algorytm nigdy nie jest szkolony na danym zbiorze danych, co oznacza, że nie ma pojęcia o cechach zbioru danych. Zadaniem algorytmu uczenia się bez nadzoru jest samodzielna identyfikacja cech obrazu. Algorytm uczenia się bez nadzoru wykona to zadanie, grupując zbiór danych obrazu w grupy zgodnie z podobieństwami między obrazami.
Dlaczego warto korzystać z uczenia się bez nadzoru?
Poniżej znajduje się kilka głównych powodów opisujących znaczenie uczenia się bez nadzoru:
- Uczenie się bez nadzoru jest pomocne w znajdowaniu przydatnych wniosków z danych.
- Uczenie się bez nadzoru jest bardzo podobne, ponieważ człowiek uczy się myśleć na podstawie własnych doświadczeń, co zbliża go do prawdziwej sztucznej inteligencji.
- Uczenie się bez nadzoru działa na nieoznaczonych i nieskategoryzowanych danych, co sprawia, że uczenie się bez nadzoru jest ważniejsze.
- W świecie rzeczywistym nie zawsze mamy dane wejściowe z odpowiadającymi im wynikami, więc aby rozwiązać takie przypadki, potrzebujemy uczenia się bez nadzoru.
Działanie uczenia się bez nadzoru
Działanie uczenia się bez nadzoru można zrozumieć na poniższym schemacie:
W tym przypadku wykorzystaliśmy nieoznaczone dane wejściowe, co oznacza, że nie są one skategoryzowane i nie podano również odpowiadających im wyników. Teraz te nieoznakowane dane wejściowe są wprowadzane do modelu uczenia maszynowego w celu jego wytrenowania. Po pierwsze, zinterpretuje surowe dane, aby znaleźć ukryte wzorce w danych, a następnie zastosuje odpowiednie algorytmy, takie jak grupowanie k-średnich, drzewo decyzyjne itp.
Po zastosowaniu odpowiedniego algorytmu algorytm dzieli obiekty danych na grupy według podobieństw i różnic między obiektami.
podwójnie połączona lista
Rodzaje algorytmów uczenia się bez nadzoru:
Algorytm uczenia się bez nadzoru można dalej podzielić na dwa typy problemów:
Uwaga: algorytmów tych nauczymy się w późniejszych rozdziałach.
Algorytmy uczenia się bez nadzoru:
Poniżej znajduje się lista niektórych popularnych algorytmów uczenia się bez nadzoru:
Zalety uczenia się bez nadzoru
- Uczenie się bez nadzoru jest wykorzystywane do bardziej złożonych zadań w porównaniu z uczeniem się pod nadzorem, ponieważ w przypadku uczenia się bez nadzoru nie mamy oznaczonych danych wejściowych.
- Preferowane jest uczenie się bez nadzoru, ponieważ łatwo jest uzyskać dane nieoznakowane w porównaniu z danymi oznaczonymi.
Wady uczenia się bez nadzoru
- Uczenie się bez nadzoru jest z natury trudniejsze niż uczenie się pod nadzorem, ponieważ nie daje odpowiednich wyników.
- Wynik algorytmu uczenia się bez nadzoru może być mniej dokładny, ponieważ dane wejściowe nie są oznaczone, a algorytmy nie znają z góry dokładnego wyniku.