Video: Løsningsforslag funksjoner i Geogebra for Matematikk 2P 2025
Linjær regresjon er en statistisk metode som analyserer og finner forhold mellom to variabler. I predictive analytics kan den brukes til å forutsi en fremtidig numerisk verdi av en variabel.
Vurder et eksempel på data som inneholder to variabler: Tidligere data som består av ankomsttidene til et tog og tilhørende forsinkelsestid. Anta at du vil forutsi hva forsinkelsen ville være for neste tog. Hvis du bruker lineær regresjon til disse to variablene - ankomst- og forsinkelsestidene - kan du generere en lineær ligning som
Forsinkelse = a + (b * Ankomsttid) + d
Denne ligningen uttrykker forholdet mellom forsinkelsestid og ankomsttid. Konstanterne a og b er modellens parametere. Variabelen d er feilperioden (også kjent som resten ) - en numerisk verdi som representerer mismatchen mellom de to variablene forsinkelse > og ankomsttid . Hvis feilen ikke er lik null, kan det tyde på at det er kriterier som påvirker variabelen forsinkelse .
a, b, og d . Linjær regresjon er (som du kanskje tror) mest egnet for lineære data. Men det er veldig følsomt mot utjevninger i datapunktene. Outliers i dataene dine kan få betydelig innvirkning på modellen. Det anbefales at du fjerner disse utjevningene fra treningssettet hvis du planlegger å bruke lineær regresjon for din prediktive modell.
