Biblioteka Pandas w Pythonie jest bardzo przydatna do manipulacji danymi matematycznymi i jest szeroko stosowana w dziedzinie uczenia maszynowego. Obejmuje wiele metod jego prawidłowego funkcjonowania. miejsce() I I loc() są jedną z tych metod. Są one używane do wycinania danych z pliku Ramka danych Pandy . Pomagają w wygodnym wyborze danych z DataFrame w Pyton . Służą do filtrowania danych według określonych warunków.
Różnica między loc() i iloc() w Pandas DataFrame
Tutaj zobaczymy różnicę między funkcją loc() i iloc() w Pandas DataFrame. Aby zobaczyć i porównać różnicę między nimi, utworzymy przykładową ramkę danych, której użyjemy w całym akapicie. Działanie obu tych metod wyjaśniono w przykładowym zbiorze danych samochodów.
Python3
0,04 jako ułamek
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Wyjście
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funkcja loc() w Pythonie
The funkcja lok(). to metoda selekcji danych oparta na etykietach, co oznacza, że musimy przekazać nazwę wiersza lub kolumny, którą chcemy wybrać. Metoda ta, w odróżnieniu od iloc(), uwzględnia ostatni element przekazanego w niej zakresu. loc() może akceptować dane logiczne w przeciwieństwie do iloc(). Wiele operacji można wykonać za pomocą metody loc(), np
Przykład 1: Wybór danych według pewnych warunków
W tym przykładzie kod używaloc>funkcja służąca do wybierania i wyświetlania wierszy z ramki DataFrame, w których marka to „Maruti” i przebieg jest większy niż 25, pokazując istotne informacje o samochodach Maruti o dużym przebiegu.
Python3
# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])> |
Java konwertuje znak na int
>
>
Wyjście
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Przykład 2: Wybieranie zakresu wierszy z ramki danych
W tym przykładzie kod wykorzystujeloc>funkcja wyodrębniająca i wyświetlająca wiersze o indeksach od 2 do 5 (włącznie) z DataFrame, dostarczająca informacji o określonym zakresie samochodów w zbiorze danych.
Python3
przejście wewnętrzne
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Wyjście
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Przykład 3: Aktualizowanie wartości dowolnej kolumny
W tym przykładzie kod używaloc>funkcja aktualizacji wartości „Przebieg” do 22 dla samochodów w ramce DataFrame, których rok produkcji przypada przed 2015. Następnie wyświetlana jest zmodyfikowana ramka DataFrame, odzwierciedlająca zmiany wprowadzone w kolumnie Przebieg.
Python3
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
>
Wyjście
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funkcja iloc() w Pythonie
The funkcja iloc(). jest metodą wybierania opartą na indeksach, co oznacza, że aby wybrać konkretny wiersz/kolumnę, musimy przekazać w niej indeks całkowity. W przeciwieństwie do loc(), metoda ta nie uwzględnia ostatniego elementu przekazanego zakresu. iloc() nie akceptuje danych boolowskich w przeciwieństwie do loc(). Operacje wykonywane przy użyciu iloc() to:
Przykład 1: Wybieranie wierszy przy użyciu indeksów całkowitych
W tym przykładzie kod wykorzystujeiloc>funkcja wyodrębniająca i wyświetlająca określone wiersze z indeksami 0, 2, 4 i 7 z DataFrame, prezentująca informacje o wybranych samochodach w zbiorze danych.
Python3
co to jest ini pulpitu
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
przeczytaj plik csv w Javie
Wyjście
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Przykład 2: Jednoczesne wybieranie zakresu kolumn i wierszy
W tym przykładzie kod wykorzystujeiloc>funkcja wyodrębniająca i wyświetlająca podzbiór ramki DataFrame, w tym wiersze od 1 do 4 i kolumny od 2 do 4. Dostarcza to informacji o określonej gamie samochodów i ich odpowiednich atrybutach w zbiorze danych.
Python3
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Wyjście
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>