Wykres pudełkowy to wykres służący do wyświetlania informacji w formie rozkładu poprzez rysowanie wykresów pudełkowych dla każdego z nich. Ten rozkład danych opiera się na pięciu zbiorach (minimum, pierwszy kwartyl, mediana, trzeci kwartyl i maksimum).
Wykresy pudełkowe w Język programowania R
Wykresy pudełkowe są tworzone w R przy użyciu metody wykres pudełkowy() funkcjonować.
Składnia: boxplot(x, dane, wycięcie, varwidth, nazwy, główne)
Parametry:
x: Ten parametr jest ustawiany jako wektor lub formuła. dane: Ten parametr ustawia ramkę danych. notch: Ten parametr jest etykietą osi poziomej. varwidth: Ten parametr jest wartością logiczną. Ustaw jako true, aby narysować szerokość ramki proporcjonalną do rozmiaru próbki. main: Ten parametr jest tytułem wykresu. nazwy: ten parametr to etykiety grup, które będą wyświetlane pod każdym wykresem pudełkowym.
Tworzenie zbioru danych
Aby zrozumieć, jak możemy utworzyć wykres pudełkowy:
- Używamy zbioru danych mtcars.
- Przyjrzyjmy się kolumnom mpg i cyl w mtcars.
R
Klawiatura w dół
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Wyjście:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Tworzenie wykresu pudełkowego
Tworzenie wykresu pudełkowego.
- Weź parametry wymagane do wykonania wykresu pudełkowego.
- Teraz rysujemy wykres zależności pomiędzy mpg i cyl.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Wyjście:

Działka pudełkowa w R
Wykres pudełkowy z użyciem wycięcia
Aby narysować wykres skrzynkowy za pomocą wcięcia:
- Za pomocą Notcha możemy dowiedzieć się, jak mediany różnych grup danych pasują do siebie.
R
przełącz Javę
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Wyjście:

Działka pudełkowa w R
przełęcz: Używa wektora kolorów (my_colors), aby zmienić kolor wypełnienia pól.
granice: Ustawia kolor obramowania pudełka na czarny.
karb: Aby zilustrować przedziały ufności, do kwadratów dodano wycięcie.
szerokość wycięcia: Zarządza szerokością nacięć.
lek: Sprawia, że kolor linii środkowej jest biały.
whiskcol: Za pomocą polecenia whiskcol ustawia kolor wąsów na czarny.
pudełkowex: Modyfikuje szerokość pudełek.
outp : ustawia kształty wartości odstających na pełne koła.
wynik: Zmienia kolor wartości odstających na czarny.
Wiele wykresów pudełkowych
Tutaj tworzymy wiele wykresów pudełkowych. Poszczególne dane, dla których wymagana jest reprezentacja wykresu skrzynkowego, opierają się na funkcji.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
niedeterministyczne automaty skończone
>
Wyjście:

Wiele działek pudełkowych w R
- W tym kodzie zaczynamy od wylistowania zmiennych w wektorze zmiennych, dla których chcemy utworzyć wykresy pudełkowe. W tym przykładzie dodałem mpg, disp, hp i wt, ale możesz zmienić tę listę, aby dostosować ją do swoich potrzeb.
- Następnie tworzony jest układ wykresu przy użyciu funkcji par i składni mfrow = c(1, długość(zmienne)), która generuje siatkę z jednym wierszem i tyloma kolumnami, ile jest zmiennych w wektorze zmiennych.
- Używamy funkcji boxplot wewnątrz pętli, aby wygenerować wykres pudełkowy dla każdej zmiennej. Funkcja get(var) dynamicznie pobiera pasujące wartości kolumn ze zbioru danych. Korzystając z podanych ustawień zmieniamy wygląd każdego wykresu pudełkowego.