Serię Pand można zdefiniować jako jednowymiarową tablicę zdolną do przechowywania różnych typów danych. Możemy łatwo przekonwertować listę, krotkę i słownik na serie, używając „ seria ' metoda. Etykiety wierszy serii nazywane są indeksami. Seria nie może zawierać wielu kolumn. Posiada następujący parametr:
liczba całkowita w porównaniu do Java
Tworzenie serii:
Serię możemy stworzyć na dwa sposoby:
- Utwórz pustą serię
- Utwórz serię za pomocą danych wejściowych.
Utwórz pustą serię:
W Pandach możemy łatwo utworzyć pustą serię, co oznacza, że nie będzie ona miała żadnej wartości.
Składnia używana do tworzenia pustej serii:
= pandas.Series()
Poniższy przykład tworzy obiekt typu Pusta Seria, który nie ma wartości i ma domyślny typ danych, tj. pływak64 .
Przykład
import pandas as pd x = pd.Series() print (x)
Wyjście
Series([], dtype: float64)
Tworzenie serii przy użyciu danych wejściowych:
Możemy tworzyć serie, korzystając z różnych danych wejściowych:
- Szyk
- Dykt
- Wartość skalarna
Tworzenie serii z tablicy:
Przed utworzeniem serii najpierw musimy zaimportować plik tępy moduł, a następnie użyj funkcji array() w programie. Jeśli dane są ndarray, przekazany indeks musi mieć tę samą długość.
Jeśli nie przekażemy indeksu, to domyślnie indeks zakres (n) jest przekazywany, gdzie n definiuje długość tablicy, tj. [0,1,2,.... zakres(długość(tablica))-1 ]
Przykład
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Wyjście
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Utwórz serię z dykt
Możemy również utworzyć serię z dict. Jeśli obiekt słownika jest przekazywany jako dane wejściowe, a indeks nie jest określony, wówczas klucze słownika są pobierane w posortowanej kolejności w celu skonstruowania indeksu .
Jeśli indeks zostanie przekazany, wartości odpowiadające konkretnej etykiecie w indeksie zostaną wyodrębnione z słownik .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Wyjście
x 0.0 y 1.0 z 2.0 dtype: float64
Utwórz serię za pomocą narzędzia Skalar:
Jeśli przyjmiemy wartości skalarne, wówczas należy podać indeks. Wartość skalarna zostanie powtórzona w celu dopasowania długości indeksu.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Wyjście
0 4 1 4 2 4 3 4 dtype: int64
Dostęp do danych z serii za pomocą pozycji:
Po utworzeniu obiektu typu Series można uzyskać dostęp do jego indeksów, danych, a nawet poszczególnych elementów.
Dostęp do danych w serii można uzyskać podobnie jak w ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Wyjście
1
Atrybuty obiektu serii
Atrybut Series definiuje się jako dowolną informację związaną z obiektem Series, taką jak rozmiar, typ danych. itp. Poniżej znajdują się niektóre atrybuty, których możesz użyć, aby uzyskać informacje o obiekcie Series:
Atrybuty | Opis |
---|---|
Indeks serii | Definiuje indeks serii. |
Seria.kształt | Zwraca krotkę kształtu danych. |
Seria.dtyp | Zwraca typ danych. |
Seria.rozmiar | Zwraca rozmiar danych. |
Seria.pusta | Zwraca True, jeśli obiekt Series jest pusty, w przeciwnym razie zwraca false. |
Seria.hasnans | Zwraca True, jeśli istnieją jakiekolwiek wartości NaN, w przeciwnym razie zwraca false. |
Seria.nbajtów | Zwraca liczbę bajtów danych. |
Seria. Jestem | Zwraca liczbę wymiarów w danych. |
Seria.rozmiar elementu | Zwraca rozmiar typu danych elementu. |
Pobieranie tablicy indeksu i tablicy danych obiektu serii
Możemy pobrać tablicę indeksów i tablicę danych istniejącego obiektu Series, używając indeksu atrybutów i wartości.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Wyjście
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Pobieranie typów (dtype) i rozmiarów typów (itemsize)
Możesz użyć atrybutu dtype z obiektem Series jako dtype do pobrania typu danych pojedynczego elementu obiektu serii, możesz użyć rozmiar przedmiotu atrybut pokazujący liczbę bajtów przydzielonych do każdego elementu danych.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Wyjście
int64 8 float64 8
Odzyskiwanie kształtu
Kształt obiektu Series określa całkowitą liczbę elementów, w tym wartości brakujące lub puste (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Wyjście
(4,) (3,)
Pobieranie wymiaru, rozmiaru i liczby bajtów:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Wyjście
1 1 4 3 32 24
Sprawdzanie pustki i obecności NaN
Aby sprawdzić, czy obiekt Series jest pusty, możesz użyć metody pusty atrybut . Podobnie, aby sprawdzić, czy obiekt serii zawiera pewne wartości NaN, czy nie, możesz użyć metody Hassan atrybut.
Przykład
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Wyjście
False False True True False False 4 3 3 3
Funkcje serii
W serii Series używane są następujące funkcje:
Funkcje | Opis |
---|---|
Seria Pandy.map() | Mapuj wartości z dwóch serii, które mają wspólną kolumnę. |
Seria Pandy.std() | Oblicz odchylenie standardowe danego zestawu liczb, ramki danych, kolumny i wierszy. |
Seria Pandy.to_frame() | Konwertuj obiekt serii na ramkę danych. |
Seria Pand.value_counts() | Zwraca serię zawierającą liczbę unikalnych wartości. |