Principal » comerç algorítmic » Regressió lineal múltiple - Definició MLR

Regressió lineal múltiple - Definició MLR

comerç algorítmic : Regressió lineal múltiple - Definició MLR
Què és la regressió lineal múltiple - MLR?

La regressió lineal múltiple (MLR), també coneguda simplement com a regressió múltiple, és una tècnica estadística que utilitza diverses variables explicatives per predir el resultat d’una variable de resposta. L’objectiu de la regressió lineal múltiple (MLR) és modelar la relació lineal entre la variable explicativa (independent) i la variable de resposta (dependent).

En essència, la regressió múltiple és l'extensió de la regressió ordinària amb menys quadrats (OLS) que inclou més d'una variable explicativa.

La fórmula per a la regressió lineal múltiple és

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵwhere, per a i = n observacions: yi = dependent variablexi = variables expanatòriesβ0 = intercepció y (terme constant) βp = coeficients de pendent per a cada variable explicativaϵ = terme d'error del model (també coneguts com a residuals) \ begin {align} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {where, for} i = n \ textbf {observations:} \\ & y_i = \ text {variable dependent} \\ & x_i = \ text {variables expanatòries} \\ & \ beta_0 = \ text {y-intercept (constant terme)} \\ & \ beta_p = \ text {coeficients de pendent per a cada variable explicativa} \\ & \ epsilon = \ text {el terme d'error del model (també conegut com a residuals)} \\ \ end {alineat} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵwhere, per a i = n observacions: yi = variablexi dependent = variables expanatòriesβ0 = intercepció y (terme constant) βp = Coeficients de pendent per a cada variable explicativaϵ = terme d'error del model (també conegut com a residuals)

Explicació de regressió lineal múltiple

Una regressió lineal simple és una funció que permet a un analista o estadista fer prediccions sobre una variable en funció de la informació que es coneix sobre una altra variable. La regressió lineal només es pot utilitzar quan es tenen dues variables contínues: una variable independent i una variable dependent. La variable independent és el paràmetre que s’utilitza per calcular la variable o el resultat depenent. Un model de regressió múltiple s’estén a diverses variables explicatives.

El model de regressió múltiple es basa en els següents supòsits:

  • Hi ha una relació lineal entre les variables dependents i les variables independents.
  • Les variables independents no estan massa correlacionades entre si.
  • i Les observacions es seleccionen de forma independent i aleatòria entre la població.
  • Els residuals haurien de distribuir-se normalment amb una mitjana de 0 i una variació σ.

El coeficient de determinació (quadrat R) és una mètrica estadística que s'utilitza per mesurar quant de la variació en el resultat es pot explicar per la variació de les variables independents. R 2 sempre augmenta a mesura que s’afegeixen més predictors al model de MLR tot i que pot ser que els predictors no estiguin relacionats amb la variable de resultat.

Per tant, R 2 no es pot utilitzar per identificar quins predictors han de ser inclosos en un model i quins haurien d'excloure. R 2 només pot estar entre 0 i 1, on 0 indica que no es pot predir el resultat per cap de les variables independents i 1 indica que el resultat es pot predir sense cap error de les variables independents.

Quan s'interpreta els resultats d'una regressió múltiple, els coeficients beta són vàlids mantenint constants totes les altres variables ("totes iguals"). La sortida d'una regressió múltiple es pot mostrar horitzontalment com una equació o verticalment en forma de taula.

Exemple amb regressió lineal múltiple

Per exemple, un analista pot voler saber com afecta la circulació del mercat al preu d’Exxon Mobil (XOM). En aquest cas, la seva equació lineal tindrà el valor de l'índex S&P 500 com a variable independent o predictora i el preu de XOM com a variable dependent.

En realitat, hi ha múltiples factors que prediuen el resultat d’un esdeveniment. El moviment de preus d’Exxon Mobil, per exemple, depèn més que del rendiment del mercat global. Altres predictors, com ara el preu del petroli, els tipus d’interès i el moviment de preus dels futurs del petroli, poden afectar el preu de la XOM i els preus d’accions d’altres companyies petrolieres. Per entendre una relació en què hi ha més de dues variables, s’utilitza una regressió lineal múltiple.

La regressió lineal múltiple (MLR) s'utilitza per determinar una relació matemàtica entre diverses variables aleatòries. En altres termes, la MLR examina com es relacionen diverses variables independents amb una variable depenent. Una vegada que cadascun dels factors independents s'ha determinat per predir la variable dependent, es pot utilitzar la informació de les múltiples variables per crear una predicció precisa del nivell d'efecte que tenen sobre la variable de resultat. El model crea una relació en forma de línia recta (lineal) que s’aproxima millor a tots els punts de dades individuals.

En referència a l’equació de la MLR anterior, en el nostre exemple:

  • y i = variable dependent: preu de XOM
  • x i1 = tipus d’interès
  • x i2 = preu del petroli
  • x i3 = valor de l’índex S&P 500
  • x i4 = preu dels futurs del petroli
  • B 0 = intercepció y al temps zero
  • B 1 = coeficient de regressió que mesura un canvi unitari en la variable dependent quan canvia x i1 : la variació del preu XOM quan canvien els tipus d’interès
  • B 2 = valor de coeficient que mesura un canvi unitari de la variable depenent quan canvia x i2 : la variació del preu XOM quan els preus del petroli canvien

Les estimacions de menys quadrats, B 0, B 1, B 2 ... B p, es calculen generalment mitjançant programari estadístic. Al model de regressió es poden incloure moltes variables en què es diferencia cada variable independent amb un nombre: 1, 2, 3, 4 ... pàg. El model de regressió múltiple permet a un analista predir un resultat basat en la informació proporcionada sobre diverses variables explicatives.

Tot i així, el model no sempre és perfectament exacte, ja que cada punt de dades pot diferir lleugerament del resultat previst pel model. El valor residual, E, que és la diferència entre el resultat real i el resultat previst, s’inclou al model per tenir en compte aquestes petites variacions.

Si suposem que executem el nostre model de regressió de preus XOM mitjançant un programari de càlcul d’estadístiques, que retorna aquesta sortida:

Un analista interpretarà aquesta producció per significar que si es mantenen altres variables constants, el preu de la XOM augmentarà un 7, 8% si el preu del petroli als mercats augmenta un 1%. El model també mostra que el preu de la XOM disminuirà un 1, 5% després d’una pujada de l’1% dels tipus d’interès. R 2 indica que el 86, 5% de les variacions en el preu de les accions d’Exxon Mobil es pot explicar per canvis en el tipus d’interès, el preu del petroli, els futurs del petroli i l’índex S&P 500.

Compres per emportar

  • La regressió lineal múltiple (MLR), també coneguda simplement com a regressió múltiple, és una tècnica estadística que utilitza diverses variables explicatives per predir el resultat d’una variable de resposta.
  • La regressió múltiple és una extensió de regressió lineal (OLS) que utilitza només una variable explicativa.
  • La MLR s'utilitza àmpliament en economia i economia.

La diferència entre la regressió lineal i la múltiple

La regressió lineal (OLS) compara la resposta d'una variable depenent donada un canvi en alguna variable explicativa. Tanmateix, és rar que una variable dependent només s’expliqui per una sola variable. En aquest cas, un analista utilitza una regressió múltiple, que intenta explicar una variable dependent utilitzant més d'una variable independent. Les regressions múltiples poden ser lineals i no lineals.

Les regressions múltiples es basen en el supòsit que hi ha una relació lineal entre les variables dependents i independents. Tampoc assumeix cap correlació important entre les variables independents.

Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.

Termes relacionats

Quines mesures de regressió La regressió és una mesura estadística que intenta determinar la força de la relació entre una variable dependent (normalment es denota per Y) i una sèrie d’altres variables canviants (conegudes com a variables independents). més Què és un terme d'error "> Un terme d'error es defineix com a una variable en un model estadístic, que es crea quan el model no representa completament la relació real entre les variables independents i dependents. Més com funciona el mètode de mínims quadrats. El mètode quadrats és una tècnica estadística per determinar la línia més adequada per a un model, especificada per una equació amb certs paràmetres a les dades observades. dades amb el propòsit de provar teories, hipòtesis i tendències futures. més R-Squared R-squared és una mesura estadística que representa la proporció de la variància per a una variable dependent que s’explica amb una variable independent. Més com funciona el coeficient de determinació El coeficient de determinació és una mesura utilitzada en l'anàlisi estadística per avaluar el bé que un model explica i prediu els resultats futurs Enllaços de rtner
Recomanat
Deixa El Teu Comentari