Ramka danych Pandy to dwuwymiarowa oznaczona struktura danych, przypominająca tabelę z wierszami i kolumnami. Rozmiar i wartości DataFrame są zmienne, tj. można je modyfikować.
DataFrame jest najczęściej używany w analizie i manipulacji danymi. Umożliwia przechowywanie danych w formie tabelarycznej, takiej jak baza danych SQL, MS Excel lub Arkusze Google, co ułatwia wykonywanie operacji arytmetycznych na danych.
Jest to najczęściej używany obiekt Pand. The Funkcja DataFrame(). służy do tworzenia ramki danych w Pandach. Możesz także utworzyć Pandas DataFrame na wiele sposobów.
Składnia Dataframe() Pandy
pandas.DataFrame(dane, indeks, kolumny)
pamięć rejestracyjna
Parametry:
- dane : Jest to zbiór danych, z którego ma zostać utworzona ramka DataFrame. Może to być lista, słownik, wartość skalarna, seria i tablice itp.
- indeks : Jest to opcjonalne, domyślnie indeks ramki DataFrame zaczyna się od 0 i kończy na ostatniej wartości danych (n-1). Definiuje jawnie etykietę wiersza.
- kolumny : Ten parametr służy do podawania nazw kolumn w ramce danych. Jeżeli nazwa kolumny nie jest zdefiniowana domyślnie, przyjmuje ona wartość od 0 do n-1.
Zwroty:
- Obiekt DataFrame
Teraz, gdy omówiliśmy funkcję DataFrame(), przyjrzyjmy się różnym sposobom tworzenia ramki DataFrame:
Różne sposoby tworzenia ramki danych w Pythonie
Istnieje kilka sposobów na utworzenie Ramka danych Pandy W Pyton . Ramkę danych można utworzyć za pomocą następujących metod:
- Utwórz Pandas DataFrame za pomocą funkcji DataFrame().
- Utwórz Pandas DataFrame z listy list
- Utwórz Pandas DataFrame ze słownika ndarray/list
- Utwórz Pandas DataFrame z listy słowników
- Utwórz Pandas DataFrame ze słownika Series
- Tworzenie DataFrame przy użyciu funkcji zip().
- Tworzenie ramki danych poprzez jawne sprawdzanie etykiety indeksu
Utwórz pustą ramkę danych przy użyciu metody DataFrame().
DataFrame w Pythonie można utworzyć za pomocą funkcji DataFrame() pliku Biblioteka Pand . Wystarczy wywołać funkcję za pomocą konstruktora DataFrame, aby utworzyć DataFrame.
Przykład : Tworzenie pustej ramki DataFrame przy użyciu funkcji DataFrame() w Pythonie
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Wyjście:
Empty DataFrame Columns: [] Index: []>
Utwórz DataFrame z list list
Aby utworzyć ramkę danych Pandas z pliku lista list, możesz użyć funkcji pd.DataFrame(). Ta funkcja pobiera listę list jako dane wejściowe i tworzy ramkę DataFrame z taką samą liczbą wierszy i kolumn jak lista wejściowa.
Przykład : Tworzenie DataFrame z list list przy użyciu metody DataFrame().
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Wyjście:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Utwórz ramkę danych ze słownika ndArray/Lists
Aby utworzyć ramkę danych z pliku słownik z ndarrays /lists, wszystkie tablice muszą mieć tę samą długość. Jeśli indeks zostanie przekazany, indeks długości powinien być równy długości tablic.
Jeśli nie zostanie przekazany żaden indeks, domyślnie będzie to indeks typu range(n), gdzie n jest długością tablicy.
Przykład : Tworzenie DataFrame ze słownika ndarray/lists
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
sen javascript
>
Wyjście:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Notatka: Podczas tworzenia DataFrame przy użyciu słownika, domyślnie kluczami słownika będą nazwy kolumn. Możemy również jawnie podać nazwy kolumn, używając parametru kolumny.
Utwórz DataFrame z listy słowników
Pandas DataFrame można utworzyć poprzez przekazanie listy słowników jako dane wejściowe. Domyślnie klucze słownika będą traktowane jako kolumny.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
numpy odchylenie standardowe
>
Wyjście:
a b c 0 1 2 3 1 10 20 30>
Innym przykładem jest utworzenie ramki danych Pandas poprzez przekazanie list słowników i indeksy wierszy .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Wyjście:
b c a first 2 3 NaN second 20 30 10.0>
Utwórz DataFrame ze słownika Series
Aby utworzyć ramkę danych ze słownika seria , słownik można przekazać w celu utworzenia ramki DataFrame. Wynikowy indeks jest sumą wszystkich serii przekazanych indeksów.
Przykład: Tworzenie ramki danych ze słownika serii.
Python3
Java 8
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Wyjście:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Utwórz DataFrame za pomocą funkcji zip().
Dwie listy można połączyć za pomocą opcji funkcja zip(). . Teraz utwórz Pandas DataFrame, wywołując funkcję pd.DataFrame().
Przykład: Tworzenie ramki danych przy użyciu funkcji zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Wyjście:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Utwórz ramkę danych, jawnie potwierdzając etykietę indeksu
Aby utworzyć ramkę DataFrame poprzez jawne podanie etykiety indeksu, można użyć parametru indeksu konstruktora pd.DataFrame(). Parametr indeksu przyjmuje jako dane wejściowe listę etykiet indeksu, a ramka DataFrame użyje tych etykiet dla wierszy ramki DataFrame.
Przykład: Tworzenie ramki danych poprzez jawne sprawdzanie etykiety indeksu
Java otwiera plik
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Wyjście:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Wniosek
Python Pandas DataFrame jest podobny do tabeli z wierszami i kolumnami. Jest to dwuwymiarowa struktura danych i jest bardzo przydatna do analizy i manipulacji danymi.
W tym samouczku omówiliśmy wiele sposobów tworzenia ramki danych Pandas. Dzięki temu samouczkowi będziesz w stanie obsłużyć wszelkie złożone wymagania dotyczące tworzenia DataFrame.