logo

Seria Pandy w Pythonie

Serię Pand można zdefiniować jako jednowymiarową tablicę zdolną do przechowywania różnych typów danych. Możemy łatwo przekonwertować listę, krotkę i słownik na serie, używając „ seria ' metoda. Etykiety wierszy serii nazywane są indeksami. Seria nie może zawierać wielu kolumn. Posiada następujący parametr:

liczba całkowita w porównaniu do Java
    dane:Może to być dowolna lista, słownik lub wartość skalarna.indeks:Wartość indeksu powinna być unikalna i umożliwiać mieszanie. Musi mieć tę samą długość co dane. Jeśli nie przekażemy żadnego indeksu, default np.rozmieść(n) będzie użyty.typ:Odnosi się do typu danych serii.Kopiuj:Służy do kopiowania danych.

Tworzenie serii:

Serię możemy stworzyć na dwa sposoby:

  1. Utwórz pustą serię
  2. Utwórz serię za pomocą danych wejściowych.

Utwórz pustą serię:

W Pandach możemy łatwo utworzyć pustą serię, co oznacza, że ​​nie będzie ona miała żadnej wartości.

Składnia używana do tworzenia pustej serii:

 = pandas.Series() 

Poniższy przykład tworzy obiekt typu Pusta Seria, który nie ma wartości i ma domyślny typ danych, tj. pływak64 .

Przykład

 import pandas as pd x = pd.Series() print (x) 

Wyjście

 Series([], dtype: float64) 

Tworzenie serii przy użyciu danych wejściowych:

Możemy tworzyć serie, korzystając z różnych danych wejściowych:

  • Szyk
  • Dykt
  • Wartość skalarna

Tworzenie serii z tablicy:

Przed utworzeniem serii najpierw musimy zaimportować plik tępy moduł, a następnie użyj funkcji array() w programie. Jeśli dane są ndarray, przekazany indeks musi mieć tę samą długość.

Jeśli nie przekażemy indeksu, to domyślnie indeks zakres (n) jest przekazywany, gdzie n definiuje długość tablicy, tj. [0,1,2,.... zakres(długość(tablica))-1 ]

Przykład

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Wyjście

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Utwórz serię z dykt

Możemy również utworzyć serię z dict. Jeśli obiekt słownika jest przekazywany jako dane wejściowe, a indeks nie jest określony, wówczas klucze słownika są pobierane w posortowanej kolejności w celu skonstruowania indeksu .

Jeśli indeks zostanie przekazany, wartości odpowiadające konkretnej etykiecie w indeksie zostaną wyodrębnione z słownik .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Wyjście

 x 0.0 y 1.0 z 2.0 dtype: float64 

Utwórz serię za pomocą narzędzia Skalar:

Jeśli przyjmiemy wartości skalarne, wówczas należy podać indeks. Wartość skalarna zostanie powtórzona w celu dopasowania długości indeksu.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Wyjście

 0 4 1 4 2 4 3 4 dtype: int64 

Dostęp do danych z serii za pomocą pozycji:

Po utworzeniu obiektu typu Series można uzyskać dostęp do jego indeksów, danych, a nawet poszczególnych elementów.

Dostęp do danych w serii można uzyskać podobnie jak w ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Wyjście

 1 

Atrybuty obiektu serii

Atrybut Series definiuje się jako dowolną informację związaną z obiektem Series, taką jak rozmiar, typ danych. itp. Poniżej znajdują się niektóre atrybuty, których możesz użyć, aby uzyskać informacje o obiekcie Series:

Atrybuty Opis
Indeks serii Definiuje indeks serii.
Seria.kształt Zwraca krotkę kształtu danych.
Seria.dtyp Zwraca typ danych.
Seria.rozmiar Zwraca rozmiar danych.
Seria.pusta Zwraca True, jeśli obiekt Series jest pusty, w przeciwnym razie zwraca false.
Seria.hasnans Zwraca True, jeśli istnieją jakiekolwiek wartości NaN, w przeciwnym razie zwraca false.
Seria.nbajtów Zwraca liczbę bajtów danych.
Seria. Jestem Zwraca liczbę wymiarów w danych.
Seria.rozmiar elementu Zwraca rozmiar typu danych elementu.

Pobieranie tablicy indeksu i tablicy danych obiektu serii

Możemy pobrać tablicę indeksów i tablicę danych istniejącego obiektu Series, używając indeksu atrybutów i wartości.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Wyjście

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Pobieranie typów (dtype) i rozmiarów typów (itemsize)

Możesz użyć atrybutu dtype z obiektem Series jako dtype do pobrania typu danych pojedynczego elementu obiektu serii, możesz użyć rozmiar przedmiotu atrybut pokazujący liczbę bajtów przydzielonych do każdego elementu danych.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Wyjście

 int64 8 float64 8 

Odzyskiwanie kształtu

Kształt obiektu Series określa całkowitą liczbę elementów, w tym wartości brakujące lub puste (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Wyjście

 (4,) (3,) 

Pobieranie wymiaru, rozmiaru i liczby bajtów:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Wyjście

 1 1 4 3 32 24 

Sprawdzanie pustki i obecności NaN

Aby sprawdzić, czy obiekt Series jest pusty, możesz użyć metody pusty atrybut . Podobnie, aby sprawdzić, czy obiekt serii zawiera pewne wartości NaN, czy nie, możesz użyć metody Hassan atrybut.

Przykład

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Wyjście

 False False True True False False 4 3 3 3 

Funkcje serii

W serii Series używane są następujące funkcje:

Funkcje Opis
Seria Pandy.map() Mapuj wartości z dwóch serii, które mają wspólną kolumnę.
Seria Pandy.std() Oblicz odchylenie standardowe danego zestawu liczb, ramki danych, kolumny i wierszy.
Seria Pandy.to_frame() Konwertuj obiekt serii na ramkę danych.
Seria Pand.value_counts() Zwraca serię zawierającą liczbę unikalnych wartości.