logo

Jak upuścić jedną lub wiele kolumn w ramce danych Pandas

Omówmy, jak upuścić jedną lub wiele kolumn w ramce danych Pandas. Aby usunąć kolumnę z a Ramka danych Pandy lub Upuść jedną lub wiele kolumn w ramce danych Pandas można osiągnąć na wiele sposobów.

Upuść jedną lub wiele kolumn w ramce danych Pandas

Istnieją różne metody upuszczania jednej lub wielu kolumn w Pandas Dataframe. Omawiamy niektóre ogólnie stosowane metody upuszczania jednej lub wielu kolumn w Pandas Dataframe, które są następujące:



  • Korzystanie z metody df.drop().
  • Za pomocą I loc[] metoda
  • Za pomocą df.ix() metoda
  • Za pomocą df.lok[] metoda
  • Korzystanie z metody iteracyjnej
  • Za pomocą Dataframe.pop() metoda

Utwórz ramkę danych

Najpierw tworzymy prostą ramkę danych ze słownikiem list, powiedzmy, że są to nazwy kolumn A, B, C, D, E . W tym artykule omówimy 6 różnych metod usuwania niektórych kolumn z Pandas DataFrame.

stos w Javie
Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df>

Wyjście :

 A B C D E   0   A1 B1 C1 D1 E1   1   A2 B2 C2 D2 E2   2   A3 B3 C3 D3 E3   3   A4 B4 C4 D4 E4   4   A5 B5 C5 D5 E5>



Kolumna upuszczania ramki danych w Pandach przy użyciu metody df.drop().

Przykład 1: W tym przykładzie usuwamy określone pojedyncze kolumny, jak używa poniższy kod Pandy aby utworzyć ramkę DataFrame ze słownika, a następnie usuwa kolumnę „A” za pomocądrop>metoda zaxis=1>. Należy jednak pamiętać, że oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że plikinplace=True>używany jest parametr lub wynik jest ponownie przypisywany do „df”.

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)>

Wyjście :

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Przykład 2: W tym przykładzie Usuń określone wiele kolumn, ponieważ poniższy kod używa Pand do utworzenia ramki DataFrame ze słownika, a następnie usuwa kolumny „C” i „D” za pomocądrop>metoda zaxis=1>. Należy jednak pamiętać, że oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że wynik zostanie przypisany z powrotem lubinplace=True>Jest używane. Alternatywnie tę samą operację można wykonać za pomocądf.drop(columns=['C', 'D'])>.



Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])>

Wyjście :

   A B E  0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>

Przykład 3: W tym przykładzie Usuń kolumny na podstawie indeksu kolumny, ponieważ poniższy kod tworzy Pandas DataFrame ze słownika i usuwa trzy kolumny („A”, „E”, „C”) na podstawie ich pozycji w indeksie przy użyciu metody `drop` z ` oś=1`. Wyświetlona zostanie zmodyfikowana ramka DataFrame, a zmiany zostaną wprowadzone na miejscu („inplace=True”).

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df>

Wyjście :

   B D  0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>

Ramki danych upuszczają kolumny w Pandach przy użyciu metody df.iloc[].

W tym przykładzie Usuń kolumny między określonymi kolumnami początkowymi i końcowymi, ponieważ poniższy kod wykorzystuje Pandy do utworzenia ramki DataFrame ze słownika, a następnie usuwa wszystkie kolumny między indeksami kolumn od 1 do 3 za pomocądrop>metoda zaxis=1>. Zmiany wprowadzane są na miejscu (inplace=True>) i zostanie wyświetlona zmodyfikowana ramka danych.

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df>

Wyjście:

 A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>

Pandy usuwają kolumny z ramki danych przy użyciu metody df.ix().

W tym przykładzie Usuń kolumny między określonymi nazwami kolumn, ponieważ poniższy kod za pomocą Pand tworzy ramkę DataFrame ze słownika i usuwa wszystkie kolumny między nazwami kolumn „B” do „D” za pomocądrop>metoda zaxis=1>. Jednakże oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że wynik zostanie przypisany z powrotem lubinplace=True>Jest używane.

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)>

Wyjście :

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Pandy usuwają kolumny z ramki danych przy użyciu metody df.loc[].

W tym przykładzie upuść kolumny między określonymi nazwami kolumn jako poniższy kod używa Pandy aby utworzyć ramkę DataFrame ze słownika, a następnie usuwa wszystkie kolumny pomiędzy nazwami kolumn „B” i „D” za pomocądrop>metoda zaxis=1>. Zmodyfikowana ramka DataFrame nie jest przypisana do żadnej zmiennej, a oryginalna ramka DataFrame pozostaje niezmieniona.

to znak specjalny
Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)>

Wyjście :

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Notatka: Inną funkcją loc() i iloc() jest funkcja iloc() wykluczająca element zakresu ostatniej kolumny.

Pandy usuwają kolumny z ramki danych przy użyciu metody iteracyjnej

W tym przykładzie Usuń kolumny między określonymi nazwami kolumn, ponieważ poniższy kod tworzy ramkę danych Pandas z pliku a słownik i iteruje po swoich kolumnach. Dla każdej kolumny, jeśli w nazwie kolumny znajduje się litera „A”, kolumna ta jest usuwana z ramki DataFrame. Wyświetlana jest wynikowa zmodyfikowana ramka danych.

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df>

Wyjście :

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Kolumna upuszczania ramki danych w Pandach przy użyciu metody Dataframe.pop().

W tym przykładzie Usuwanie określonej kolumny z ramki danych w kodzie pokazano, jak usunąć określoną kolumnę („B”) z ramki danych Pandas utworzonej na podstawie słownika. Używa pop> metodę i zostanie wyświetlona zmodyfikowana ramka DataFrame.

Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df>

Wyjście:

A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>