Python to świetny język do analizy danych, przede wszystkim ze względu na fantastyczny ekosystem pakietów Pythona zorientowanych na dane. Pandy to jeden z tych pakietów, który znacznie ułatwia importowanie i analizowanie danych. Tworząc Ramka danych Pandy można osiągnąć na wiele sposobów. Zobaczmy, jak możemy utworzyć ramkę danych Pandas z list.
ciąg w tablicy w c
Tworzenie ramek danych Pandas z list
Konwertowanie list na ramki DataFrame ma kluczowe znaczenie w analizie danych, umożliwiając łatwe wykonywanie zaawansowanych manipulacji i analiz danych.
Tutaj omówimy różne sposoby tworzenia ramki danych Pandas z list:
- Utwórz ramkę danych z listy za pomocą konstruktora
- Utwórz ramkę danych z listy za pomocą słownika
- Utwórz ramkę danych z listy za pomocą zip()
- Utwórz DataFrame z listy, zmieniając typ danych
- Utwórz DataFrame z listy przy użyciu listy wielowymiarowej
- Utwórz DataFrame z listy z nazwami indeksów i kolumn
Utwórz ramkę danych z listy za pomocą konstruktora
Aby przekonwertować listę na ramkę danych Pandas, możesz użyć metodypd.DataFrame()>konstruktor. Ta funkcja przyjmuje listę jako dane wejściowe i tworzy ramkę DataFrame z taką samą liczbą wierszy i kolumn jak lista wejściowa.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)>
Wyjście:
0 0 Geeks 1 For 2 Geeks 3 is 4 portal 5 for 6 Geeks>
Utwórz ramkę danych z listy za pomocą słownika
Aby użyć list w słowniku do utworzenia ramki danych Pandas, tworzymy słownik list, a następnie przekazujemy słownik dopd.DataFrame()>konstruktor. Opcjonalnie możemy określić nazwy kolumn dla DataFrame, przekazując listę ciągów docolumns>parametrpd.DataFrame()>konstruktor.
# importing pandas as pd import pandas as pd # list of name, degree, score nme = ['aparna', 'pankaj', 'sudhir', 'Geeku'] deg = ['MBA', 'BCA', 'M.Tech', 'MBA'] scr = [90, 40, 80, 98] # dictionary of lists dict = {'name': nme, 'degree': deg, 'score': scr} df = pd.DataFrame(dict) print(df)> Wyjście:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98>
Utwórz ramkę danych z listy za pomocą zip()
Aby utworzyć ramkę danych Pandas z list przy użyciu zamek błyskawiczny(). Możemy także skorzystać zzip()>funkcja spajająca wiele list w celu utworzenia ramki DataFrame z większą liczbą kolumn.
Pyton
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # list of int lst2 = [11, 22, 33, 44, 55, 66, 77] # Calling DataFrame constructor after zipping # both lists, with columns specified df = pd.DataFrame(list(zip(lst, lst2)), columns =['Name', 'val']) print(df)>
Wyjście:
Name val 0 Geeks 11 1 For 22 2 Geeks 33 3 is 44 4 portal 55 5 for 66 6 Geeks 77>
Utwórz ramkę danych z listy, zmieniając typ danych
Aby utworzyć ramkę danych Pandas przy użyciu wielowymiarowej listy z określonymi nazwami kolumn i typami. Określając dtypes, możemy mieć pewność, że DataFrame zostanie utworzona z poprawnymi typami danych.
Pyton import pandas as pd # List1 lst = [['tom', 'reacher', 25], ['krish', 'pete', 30], ['nick', 'wilson', 26], ['juli', 'williams', 22]] # Create DataFrame df = pd.DataFrame(lst, columns=['FName', 'LName', 'Age']) # Convert 'Age' column to float df['Age'] = df['Age'].astype(float) print(df)>
Wyjście:
FName LName Age 0 tom reacher 25.0 1 krish pete 30.0 2 nick wilson 26.0 3 juli williams 22.0>
Utwórz ramkę danych z listy przy użyciu listy wielowymiarowej
Aby utworzyć ramkę danych przy użyciu listy wielowymiarowej, możesz użyć metodypd.DataFrame()>konstruktor. Thepd.DataFrame()>konstruktor pobiera listę list jako dane wejściowe i tworzy ramkę DataFrame z taką samą liczbą wierszy i kolumn jak lista wejściowa.
# import pandas as pd import pandas as pd # List1 lst = [['tom', 25], ['krish', 30], ['nick', 26], ['juli', 22]] df = pd.DataFrame(lst, columns =['Name', 'Age']) print(df)>
Wyjście:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Utwórz DataFrame z listy z nazwami indeksów i kolumn
Aby utworzyć ramkę danych przy użyciu listy z nazwami indeksów i kolumn, możesz użyć metodypd.DataFrame()>konstruktor zindex>Icolumns>parametry.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list # with indices and columns specified df = pd.DataFrame(lst, index =['a', 'b', 'c', 'd', 'e', 'f', 'g'], columns =['Names']) print(df)>
Wyjście:
Names a Geeks b For c Geeks d is e portal f for g Geeks>