logo

Jak sortować ramkę danych Pand?

Sortowanie możemy wykonać w Pandas Dataframe. W tym artykule omówiono sposób sortowania ramki danych Pandas przy użyciu różnych metod Pyton .

Sortowanie ramek danych w Pandach

Tworząc Ramka danych Pandy na potrzeby demonstracji, tutaj stworzyliśmy ramkę danych, w której będziemy wykonywać różne funkcje sortowania.

Python3






Shreya Ghoshal, pierwszy mąż

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Wyjście

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramki danych Pandy

Aby posortować ramkę danych w pandach, należy użyć funkcji sort_values() Jest używane. Pandy sort_values() może posortować ramkę danych w kolejności rosnącej lub malejącej.

Sortowanie ramek danych Pandy w kolejności rosnącej

Fragment kodu sortuje ramkę DataFrame df w kolejności rosnącej na podstawie kolumny „Kraj”. Jednak nie przechowuje ani nie wyświetla posortowanej ramki danych.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramki danych Pandas w kolejności malejącej

DataFrame df zostanie posortowana w kolejności malejącej na podstawie kolumny Populacja, przy czym kraj o największej populacji pojawi się na górze ramki DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

>

>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortuj ramki danych Pandy na podstawie próbkowania

Tutaj sortujemy ramkę danych (df>) na podstawie kolumny „Populacja”, układając wiersze z brakującymi wartościami w „Populacja”, tak aby pojawiały się jako pierwsze. Thesort_values()>metoda zna_position='first'>argument pozwala to osiągnąć, nadając priorytet wierszom z brakującymi wartościami na początku posortowanej ramki danych.

Python3




stosuj Javę

# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramek danych według wielu kolumn

W tym przykładzie sortujemy ramkę danych (df>) przede wszystkim w kolumnie „Kraj” w porządku rosnącym oraz, w ramach każdej grupy krajów, w kolumnie „Kontynent”. Wynikowa ramka DataFrame jest sortowana w oparciu o określoną kolejność kolumn, tworząc posortowany zestaw danych.

Python3

tablica ciągów w języku c




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramek danych według kolumn, ale w innej kolejności

W tym przykładzie sortujemy ramkę danych (df>) najpierw w kolumnie „Kraj” w porządku malejącym, a w ramach każdej grupy krajów w kolumnie „Kontynent” w porządku rosnącym. Wynikowa ramka DataFrame jest zorganizowana w oparciu o określone kryteria sortowania kolumn.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand