logo

Połączenie pand

Pandas potrafi łączyć obiekty Series, DataFrame i Panel za pomocą różnych rodzajów logiki zestawów dla indeksów i funkcjonalności algebry relacyjnej.

The połączyć() Funkcja odpowiada za wykonanie operacji konkatenacji wzdłuż osi w DataFrame.

Składnia:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametry:

    obiekty:Jest to sekwencja lub mapowanie serii lub obiektów DataFrame.
    Jeśli przekażemy dyktando w ramce danych, posortowane klucze zostaną użyte jako klucze i w tym przypadku wartości zostaną wybrane. Jeśli obecne są jakieś nieobiekty, zostanie ono odrzucone, chyba że wszystkie są niczym i w tym przypadku a Błąd wartości zostanie podniesione.oś:Jest to oś, wzdłuż której można ją łączyć.dołączyć:Odpowiedzialny za obsługę indeksów na innej osi.połącz_osie:Lista obiektów indeksu. Zamiast wykonywać wewnętrzną lub zewnętrzną logikę zbioru, dla drugiej osi (n-1) używane są określone indeksy.ignorować_indeks:bool, wartość domyślna Fałsz
    Nie używa wartości indeksu na osi konkatenacji, jeśli ma wartość true. Wynikowa oś zostanie oznaczona jako 0, ..., n - 1.

Zwroty

Seria jest zwracana, gdy połączymy wszystkie serie wzdłuż osi (oś = 0). W razie gdyby obj zawiera co najmniej jedną ramkę DataFrame, zwraca ramkę DataFrame.

Przykład 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Wyjście

kiedy wynaleziono pierwszy komputer
 0 p 1 q 0 r 1 s dtype: object 

Przykład 2: W powyższym przykładzie możemy zresetować istniejący indeks za pomocą ignorować_indeks parametr. Poniższy kod demonstruje działanie ignorować_indeks .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Wyjście

klucz do laptopa
 0 p 1 q 2 r 3 s dtype: object 

Przykład 3: Możemy dodać indeks hierarchiczny na najbardziej zewnętrznym poziomie danych, używając metody Klucze parametr.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Wyjście

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Przykład 4: Możemy oznaczyć klucze indeksu za pomocą nazwy parametr. Poniższy kod pokazuje działanie parametru name.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Wyjście

bash łączy ciągi znaków
 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Łączenie za pomocą dołączania

Metoda dołączania jest zdefiniowana jako przydatny skrót do łączenia serii i ramki danych.

Przykład:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Wyjście

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88