Sortowanie możemy wykonać w Pandas Dataframe. W tym artykule omówiono sposób sortowania ramki danych Pandas przy użyciu różnych metod Pyton .
Sortowanie ramek danych w Pandach
Tworząc Ramka danych Pandy na potrzeby demonstracji, tutaj stworzyliśmy ramkę danych, w której będziemy wykonywać różne funkcje sortowania.
Python3
Shreya Ghoshal, pierwszy mąż
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df> |
>
>
Wyjście

Sortuj ramkę danych Pand
Sortowanie ramki danych Pandy
Aby posortować ramkę danych w pandach, należy użyć funkcji sort_values() Jest używane. Pandy sort_values() może posortować ramkę danych w kolejności rosnącej lub malejącej.
Sortowanie ramek danych Pandy w kolejności rosnącej
Fragment kodu sortuje ramkę DataFrame df w kolejności rosnącej na podstawie kolumny „Kraj”. Jednak nie przechowuje ani nie wyświetla posortowanej ramki danych.
Python3
# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])> |
>
>
Wyjście:

Sortuj ramkę danych Pand
Sortowanie ramki danych Pandas w kolejności malejącej
DataFrame df zostanie posortowana w kolejności malejącej na podstawie kolumny Populacja, przy czym kraj o największej populacji pojawi się na górze ramki DataFrame.
Python3
# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)> |
>
>
Wyjście:

Sortuj ramkę danych Pand
Sortuj ramki danych Pandy na podstawie próbkowania
Tutaj sortujemy ramkę danych (df>) na podstawie kolumny „Populacja”, układając wiersze z brakującymi wartościami w „Populacja”, tak aby pojawiały się jako pierwsze. Thesort_values()>metoda zna_position='first'>argument pozwala to osiągnąć, nadając priorytet wierszom z brakującymi wartościami na początku posortowanej ramki danych.
Python3
stosuj Javę
# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)> |
>
>
Wyjście:

Sortuj ramkę danych Pand
Sortowanie ramek danych według wielu kolumn
W tym przykładzie sortujemy ramkę danych (df>) przede wszystkim w kolumnie „Kraj” w porządku rosnącym oraz, w ramach każdej grupy krajów, w kolumnie „Kontynent”. Wynikowa ramka DataFrame jest sortowana w oparciu o określoną kolejność kolumn, tworząc posortowany zestaw danych.
Python3
tablica ciągów w języku c
# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])> |
>
>
Wyjście:

Sortuj ramkę danych Pand
Sortowanie ramek danych według kolumn, ale w innej kolejności
W tym przykładzie sortujemy ramkę danych (df>) najpierw w kolumnie „Kraj” w porządku malejącym, a w ramach każdej grupy krajów w kolumnie „Kontynent” w porządku rosnącym. Wynikowa ramka DataFrame jest zorganizowana w oparciu o określone kryteria sortowania kolumn.
Python3
# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])> |
>
>
Wyjście:

Sortuj ramkę danych Pand