logo

Uczenie maszynowe bez nadzoru

W poprzednim temacie nauczyliśmy się nadzorowanego uczenia maszynowego, w którym modele są szkolone przy użyciu oznakowanych danych pod nadzorem danych uczących. Może się jednak zdarzyć wiele przypadków, w których nie mamy oznaczonych etykietą danych i musimy znaleźć ukryte wzorce z danego zbioru danych. Aby więc rozwiązywać tego typu przypadki w uczeniu maszynowym, potrzebujemy technik uczenia się bez nadzoru.

Co to jest uczenie się bez nadzoru?

Jak sama nazwa wskazuje, uczenie się bez nadzoru to technika uczenia maszynowego, w której modele nie są nadzorowane przy użyciu zbioru danych szkoleniowych. Zamiast tego modele same znajdują ukryte wzorce i spostrzeżenia na podstawie danych. Można to porównać do uczenia się, które odbywa się w ludzkim mózgu podczas uczenia się nowych rzeczy. Można to zdefiniować jako:

znak wodny w słowie
Uczenie się bez nadzoru to rodzaj uczenia maszynowego, w którym modele są szkolone przy użyciu nieoznakowanego zbioru danych i mogą działać na tych danych bez żadnego nadzoru.

Uczenia się bez nadzoru nie można bezpośrednio zastosować do problemu regresji lub klasyfikacji, ponieważ w przeciwieństwie do uczenia się pod nadzorem mamy dane wejściowe, ale nie odpowiadające im dane wyjściowe. Celem uczenia się bez nadzoru jest znajdź podstawową strukturę zbioru danych, pogrupuj dane według podobieństw i przedstaw ten zbiór danych w skompresowanym formacie .

Przykład: Załóżmy, że algorytm uczenia się bez nadzoru otrzymuje wejściowy zbiór danych zawierający obrazy różnych typów kotów i psów. Algorytm nigdy nie jest szkolony na danym zbiorze danych, co oznacza, że ​​nie ma pojęcia o cechach zbioru danych. Zadaniem algorytmu uczenia się bez nadzoru jest samodzielna identyfikacja cech obrazu. Algorytm uczenia się bez nadzoru wykona to zadanie, grupując zbiór danych obrazu w grupy zgodnie z podobieństwami między obrazami.

Nadzorowane uczenie maszynowe

Dlaczego warto korzystać z uczenia się bez nadzoru?

Poniżej znajduje się kilka głównych powodów opisujących znaczenie uczenia się bez nadzoru:

  • Uczenie się bez nadzoru jest pomocne w znajdowaniu przydatnych wniosków z danych.
  • Uczenie się bez nadzoru jest bardzo podobne, ponieważ człowiek uczy się myśleć na podstawie własnych doświadczeń, co zbliża go do prawdziwej sztucznej inteligencji.
  • Uczenie się bez nadzoru działa na nieoznaczonych i nieskategoryzowanych danych, co sprawia, że ​​uczenie się bez nadzoru jest ważniejsze.
  • W świecie rzeczywistym nie zawsze mamy dane wejściowe z odpowiadającymi im wynikami, więc aby rozwiązać takie przypadki, potrzebujemy uczenia się bez nadzoru.

Działanie uczenia się bez nadzoru

Działanie uczenia się bez nadzoru można zrozumieć na poniższym schemacie:

Nadzorowane uczenie maszynowe

W tym przypadku wykorzystaliśmy nieoznaczone dane wejściowe, co oznacza, że ​​nie są one skategoryzowane i nie podano również odpowiadających im wyników. Teraz te nieoznakowane dane wejściowe są wprowadzane do modelu uczenia maszynowego w celu jego wytrenowania. Po pierwsze, zinterpretuje surowe dane, aby znaleźć ukryte wzorce w danych, a następnie zastosuje odpowiednie algorytmy, takie jak grupowanie k-średnich, drzewo decyzyjne itp.

Po zastosowaniu odpowiedniego algorytmu algorytm dzieli obiekty danych na grupy według podobieństw i różnic między obiektami.

podwójnie połączona lista

Rodzaje algorytmów uczenia się bez nadzoru:

Algorytm uczenia się bez nadzoru można dalej podzielić na dwa typy problemów:

Nadzorowane uczenie maszynowe
    Grupowanie: Grupowanie to metoda grupowania obiektów w skupienia w taki sposób, że obiekty o największym podobieństwie pozostają w grupie i mają mniejsze lub żadne podobieństwa z obiektami z innej grupy. Analiza skupień znajduje podobieństwa między obiektami danych i kategoryzuje je według obecności i braku tych podobieństw.Stowarzyszenie: Reguła asocjacji to metoda uczenia się bez nadzoru, używana do wyszukiwania zależności między zmiennymi w dużej bazie danych. Określa zbiór elementów występujących razem w zbiorze danych. Reguła asocjacyjna zwiększa skuteczność strategii marketingowej. Na przykład ludzie, którzy kupują produkt X (załóżmy, że chleb), zwykle kupują również artykuł Y (masło/dżem). Typowym przykładem reguły asocjacyjnej jest analiza koszyka rynkowego.

Uwaga: algorytmów tych nauczymy się w późniejszych rozdziałach.

Algorytmy uczenia się bez nadzoru:

Poniżej znajduje się lista niektórych popularnych algorytmów uczenia się bez nadzoru:

    K-oznacza grupowanie KNN (k-najbliższych sąsiadów) Klastrowanie hierarchiczne Wykrywanie anomalii Sieci neuronowe Analiza głównych składników Niezależna analiza komponentów Algorytm aprioryczny Rozkład według wartości osobliwych

Zalety uczenia się bez nadzoru

  • Uczenie się bez nadzoru jest wykorzystywane do bardziej złożonych zadań w porównaniu z uczeniem się pod nadzorem, ponieważ w przypadku uczenia się bez nadzoru nie mamy oznaczonych danych wejściowych.
  • Preferowane jest uczenie się bez nadzoru, ponieważ łatwo jest uzyskać dane nieoznakowane w porównaniu z danymi oznaczonymi.

Wady uczenia się bez nadzoru

  • Uczenie się bez nadzoru jest z natury trudniejsze niż uczenie się pod nadzorem, ponieważ nie daje odpowiednich wyników.
  • Wynik algorytmu uczenia się bez nadzoru może być mniej dokładny, ponieważ dane wejściowe nie są oznaczone, a algorytmy nie znają z góry dokładnego wyniku.