Omówmy, jak upuścić jedną lub wiele kolumn w ramce danych Pandas. Aby usunąć kolumnę z a Ramka danych Pandy lub Upuść jedną lub wiele kolumn w ramce danych Pandas można osiągnąć na wiele sposobów.
Upuść jedną lub wiele kolumn w ramce danych Pandas
Istnieją różne metody upuszczania jednej lub wielu kolumn w Pandas Dataframe. Omawiamy niektóre ogólnie stosowane metody upuszczania jednej lub wielu kolumn w Pandas Dataframe, które są następujące:
- Korzystanie z metody df.drop().
- Za pomocą I loc[] metoda
- Za pomocą df.ix() metoda
- Za pomocą df.lok[] metoda
- Korzystanie z metody iteracyjnej
- Za pomocą Dataframe.pop() metoda
Utwórz ramkę danych
Najpierw tworzymy prostą ramkę danych ze słownikiem list, powiedzmy, że są to nazwy kolumn A, B, C, D, E . W tym artykule omówimy 6 różnych metod usuwania niektórych kolumn z Pandas DataFrame.
stos w JaviePyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df> Wyjście :
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E2 2 A3 B3 C3 D3 E3 3 A4 B4 C4 D4 E4 4 A5 B5 C5 D5 E5>
Kolumna upuszczania ramki danych w Pandach przy użyciu metody df.drop().
Przykład 1: W tym przykładzie usuwamy określone pojedyncze kolumny, jak używa poniższy kod Pandy aby utworzyć ramkę DataFrame ze słownika, a następnie usuwa kolumnę „A” za pomocądrop>metoda zaxis=1>. Należy jednak pamiętać, że oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że plikinplace=True>używany jest parametr lub wynik jest ponownie przypisywany do „df”.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)> Wyjście :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Przykład 2: W tym przykładzie Usuń określone wiele kolumn, ponieważ poniższy kod używa Pand do utworzenia ramki DataFrame ze słownika, a następnie usuwa kolumny „C” i „D” za pomocądrop>metoda zaxis=1>. Należy jednak pamiętać, że oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że wynik zostanie przypisany z powrotem lubinplace=True>Jest używane. Alternatywnie tę samą operację można wykonać za pomocądf.drop(columns=['C', 'D'])>.
Pyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])> Wyjście :
A B E 0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>
Przykład 3: W tym przykładzie Usuń kolumny na podstawie indeksu kolumny, ponieważ poniższy kod tworzy Pandas DataFrame ze słownika i usuwa trzy kolumny („A”, „E”, „C”) na podstawie ich pozycji w indeksie przy użyciu metody `drop` z ` oś=1`. Wyświetlona zostanie zmodyfikowana ramka DataFrame, a zmiany zostaną wprowadzone na miejscu („inplace=True”).
Pyton # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df> Wyjście :
B D 0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>
Ramki danych upuszczają kolumny w Pandach przy użyciu metody df.iloc[].
W tym przykładzie Usuń kolumny między określonymi kolumnami początkowymi i końcowymi, ponieważ poniższy kod wykorzystuje Pandy do utworzenia ramki DataFrame ze słownika, a następnie usuwa wszystkie kolumny między indeksami kolumn od 1 do 3 za pomocądrop>metoda zaxis=1>. Zmiany wprowadzane są na miejscu (inplace=True>) i zostanie wyświetlona zmodyfikowana ramka danych.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df> Wyjście:
A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>
Pandy usuwają kolumny z ramki danych przy użyciu metody df.ix().
W tym przykładzie Usuń kolumny między określonymi nazwami kolumn, ponieważ poniższy kod za pomocą Pand tworzy ramkę DataFrame ze słownika i usuwa wszystkie kolumny między nazwami kolumn „B” do „D” za pomocądrop>metoda zaxis=1>. Jednakże oryginalna ramka DataFrame („df”) pozostaje niezmieniona, chyba że wynik zostanie przypisany z powrotem lubinplace=True>Jest używane.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)> Wyjście :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Pandy usuwają kolumny z ramki danych przy użyciu metody df.loc[].
W tym przykładzie upuść kolumny między określonymi nazwami kolumn jako poniższy kod używa Pandy aby utworzyć ramkę DataFrame ze słownika, a następnie usuwa wszystkie kolumny pomiędzy nazwami kolumn „B” i „D” za pomocądrop>metoda zaxis=1>. Zmodyfikowana ramka DataFrame nie jest przypisana do żadnej zmiennej, a oryginalna ramka DataFrame pozostaje niezmieniona.
to znak specjalnyPyton
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)> Wyjście :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Notatka: Inną funkcją loc() i iloc() jest funkcja iloc() wykluczająca element zakresu ostatniej kolumny.
Pandy usuwają kolumny z ramki danych przy użyciu metody iteracyjnej
W tym przykładzie Usuń kolumny między określonymi nazwami kolumn, ponieważ poniższy kod tworzy ramkę danych Pandas z pliku a słownik i iteruje po swoich kolumnach. Dla każdej kolumny, jeśli w nazwie kolumny znajduje się litera „A”, kolumna ta jest usuwana z ramki DataFrame. Wyświetlana jest wynikowa zmodyfikowana ramka danych.
Pyton # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df> Wyjście :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Kolumna upuszczania ramki danych w Pandach przy użyciu metody Dataframe.pop().
W tym przykładzie Usuwanie określonej kolumny z ramki danych w kodzie pokazano, jak usunąć określoną kolumnę („B”) z ramki danych Pandas utworzonej na podstawie słownika. Używa pop> metodę i zostanie wyświetlona zmodyfikowana ramka DataFrame.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df> Wyjście:
A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>