logo

Uzyskaj unikalne wartości z kolumny w Pandas DataFrame

Funkcja Unique() usuwa wszystkie zduplikowane wartości w kolumnie i zwraca jedną wartość dla wielu takich samych wartości. W tym artykule omówimy, w jaki sposób możemy uzyskać unikalne wartości z kolumny w Ramka danych Pandy .

Tworzenie ramki danych Pandas ze zduplikowanymi elementami

Utwórz przykładową ramkę danych Pandy ze słownikiem list, powiedzmy, że są to nazwy kolumn A, B, C, D i E ze zduplikowanymi elementami.



Python3








Jak znaleźć ukryte aplikacje na Androidzie
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

>

>

Uzyskaj unikalne wartości z kolumny w Pandas DataFrame

Poniżej znajduje się kilka przykładów, dzięki którym możemy uzyskać unikalne wartości kolumny w tej ramce danych.

  • Uzyskaj unikalne wartości kolumny „B”.
  • Uzyskaj unikalne wartości kolumny „E”.
  • Uzyskaj liczbę unikalnych wartości w kolumnie
  • Użycie set() do wyeliminowania zduplikowanych wartości z kolumny
  • Korzystanie z metod pandas.concat() i Unique().
  • Korzystanie z Series.drop_duplicates()

Uzyskaj unikalne wartości kolumny „B”.

W tym przykładzie pobieramy i drukujemy unikalne wartości z kolumny „B” za pomocą unique()> metoda. Wynikowe unikalne wartości to['B1', 'B2', 'B3', 'B4']>.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

>

>

Wyjście

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Uzyskaj unikalne wartości pand w kolumnie „E”.

W tym przykładzie tworzymy ramkę danych pandy ze słownika, a następnie pobieramy unikalne wartości z kolumny „E” za pomocą metodyunique()>metoda. Wynikowe unikalne wartości to['E1']>.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

>

>

Wyjście

array(['E1'], dtype=object)>

Uzyskaj liczbę unikalnych wartości w kolumnie

W tym przykładzie tworzymy pandę DataFrame ze słownika, a następnie obliczamy i drukujemy liczbę unikalnych wartości w kolumnie „C”, z wyłączeniem wartości NaN. Wynik to 3, co oznacza, że ​​w kolumnie „C” znajdują się trzy unikalne wartości.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

>

>

Wyjście

supw
3>

Wyeliminuj zduplikowane wartości z kolumny za pomocą set()

W tym przykładzie tworzymy ramkę danych pand ze słownika, a następnie używamy set()>funkcjonować aby wyodrębnić unikalne wartości z kolumny „C”, eliminując duplikaty. Powstały zestaw,{'C1', 'C2', 'C3'}>, reprezentuje unikalne wartości w kolumnie „C”.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

>

>

Wyjście

{'C1', 'C2', 'C3'}>

Korzystanie z metod pandas.concat() i Unique().

W tym przykładzie tworzymy ramkę danych pand ze słownika, a następnie łączymy unikalne wartości ze wszystkich kolumn za pomocą pd.concat()> . Wynikowa tablica NumPy po wydrukowaniu wyświetla wszystkie unikalne wartości z kolumn „A” do „E”.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

>

>

Wyjście

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Korzystanie z Series.drop_duplicates()

W tym przykładzie tworzymy ramkę danych pandy ze słownika i usuwamy duplikaty z kolumn „A” i „D” za pomocą drop_duplicates()>metoda . Powstała ramka DataFrame po wydrukowaniu wyświetla unikalne wartości w kolumnach „A” i „D” z wartościami NaN, w których usunięto duplikaty z „D”.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

>

>

Wyjście

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>