logo

Jak używać funkcji lm() w R, aby dopasować modele liniowe?

W tym artykule dowiemy się, jak używać funkcji lm() do dopasowywania modeli liniowych w języku programowania R.

Model liniowy służy do przewidywania wartości nieznanej zmiennej na podstawie zmiennych niezależnych. Stosowany jest głównie do ustalania związku między zmiennymi i prognozowania. Funkcja lm() służy do dopasowywania modeli liniowych do ramek danych w języku R. Można go wykorzystać do przeprowadzenia regresji, jednowarstwowej analizy wariancji i analizy kowariancji w celu przewidzenia wartości odpowiadającej danym, które nie znajdują się w ramce danych. Są one bardzo pomocne w przewidywaniu ceny nieruchomości, prognozowaniu pogody itp.



Aby dopasować model liniowy w języku R za pomocą lm() Funkcja Najpierw używamy funkcji data.frame(), aby utworzyć przykładową ramkę danych zawierającą wartości, które należy dopasować do modelu liniowego za pomocą funkcji regresji. Następnie używamy funkcji lm(), aby dopasować określoną funkcję do danej ramki danych.

Składnia:

lm(formuła_dopasowania, ramka danych)



Parametr:

    Fiting_formula: określa wzór dla modelu liniowego. ramka danych: określa nazwę ramki danych zawierającej dane.

Następnie możemy użyć funkcji podsumowania(), aby wyświetlić podsumowanie modelu liniowego. Funkcja podsumowanie() interpretuje najważniejsze wartości statystyczne do analizy modelu liniowego.

bieżąca data w Javie

Składnia:



podsumowanie(model_liniowy)

Podsumowanie zawiera następujące kluczowe informacje:

    Resztkowy błąd standardowy: określa odchylenie standardowe błędu, gdzie pierwiastek kwadratowy wariancji odejmuje n minus 1 + # zaangażowanych zmiennych zamiast dzielenia przez n-1. Wiele R-kwadratów: określa, jak dobrze model pasuje do danych. Skorygowany R-kwadrat: normalizuje wielokrotny R-kwadrat, biorąc pod uwagę liczbę posiadanych próbek i liczbę używanych zmiennych. F-Statistic: to globalny test sprawdzający, czy przynajmniej jeden ze współczynników jest różny od zera.

Przykład: Przykład pokazujący użycie funkcji lm().

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Wyjście:

Dzwonić:

lm(formuła = y ~ x^2, dane = df)

Pozostałości:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Współczynniki:

Oszacuj standard. Błąd wartości t Pr(>|t|)

(Przecięcie) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Znaczenie. kody: 0 „***” 0,001 „**” 0,01 „*” 0,05 „.” 0,1 „ ” 1

Resztkowy błąd standardowy: 2,944 na 3 stopniach swobody

Wielokrotny R-kwadrat: 0,9326, skorygowany R-kwadrat: 0,9102

Statystyka F: 41,54 na 1 i 3 DF, wartość p: 0,007575

Wykresy diagnostyczne

Wykresy diagnostyczne pomagają nam zobaczyć związek pomiędzy różnymi wartościami statystycznymi modelu. Pomaga nam to w analizie zakresu wartości odstających i efektywności dopasowanego modelu. Aby wyświetlić wykresy diagnostyczne modelu liniowego, używamy funkcji plot() w języku R.

Składnia:

wykres(model_liniowy)

Przykład: Wykresy diagnostyczne dla powyższego dopasowanego modelu liniowego.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Wyjście:

Wykreślanie modelu liniowego

Możemy wykreślić powyższy dopasowany model liniowy, aby dobrze go zwizualizować, używając metody abline(). Najpierw wykreślamy wykres punktowy punktów danych, a następnie nakładamy na niego wykres abliny modelu liniowego za pomocą funkcji abline().

Składnia:

wykres(df$x, df$y)

atoi c

abline(model_liniowy)

Przykład: Wykreślanie modelu liniowego

R




ciąg do int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Wyjście:

Przewiduj wartości dla nieznanych punktów danych, korzystając z dopasowanego modelu

Aby przewidzieć wartości nowych danych wejściowych za pomocą powyższego dopasowanego modelu liniowego, używamy funkcji przewidywania(). Funkcja przewidywania() pobiera model i ramkę danych z nieznanymi punktami danych i przewiduje wartość każdego punktu danych zgodnie z dopasowanym modelem.

Składnia:

przewidywać (model, dane)

Parametr:

    model: określa model liniowy. dane: określa ramkę danych z nieznanymi punktami danych.

Przykład: Przewidywanie nowatorskich danych wejściowych

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Wyjście:

1 2 3 83 89 95>