Principal » comerç algorítmic » Fonaments bàsics sobre la regressió per a l'anàlisi empresarial

Fonaments bàsics sobre la regressió per a l'anàlisi empresarial

comerç algorítmic : Fonaments bàsics sobre la regressió per a l'anàlisi empresarial

Si alguna vegada us heu preguntat com es relacionen dues o més dades entre si (per exemple, com es veu afectat el PIB per canvis d’atur i inflació), o si alguna vegada heu tingut el cap, us demaneu que creeu una previsió o que analitzeu prediccions basades. en relació amb les variables, i aprendre l'anàlisi de regressió val la pena el seu temps.

En aquest article, coneixereu els fonaments bàsics de la regressió lineal simple, de vegades anomenada "mínima quadrada ordinària" o regressió OLS, una eina que s'utilitza habitualment en la previsió i l'anàlisi financera. Començarem per aprendre els principis bàsics de la regressió, primer aprenent sobre covariància i correlació, i després passarem a construir i interpretar una sortida de regressió. El popular programari empresarial, com Microsoft Excel, pot fer tots els càlculs i sortides de regressió, però encara és important aprendre la mecànica subjacent.

Les variables

Al centre d’un model de regressió hi ha la relació entre dues variables diferents, anomenades variables dependents i independents. Per exemple, suposem que voleu preveure les vendes de la vostra empresa i heu conclòs que les vendes de la vostra empresa augmenten i baixaran en funció dels canvis del PIB.

Les vendes que preveieu serien la variable dependent, ja que el seu valor "depèn" del valor del PIB i el PIB seria la variable independent. Aleshores, haureu de determinar la força de la relació entre aquestes dues variables per tal de predir les vendes. Si el PIB augmenta / disminueix un 1%, quant augmentaran o disminuiran les vendes?

Covariància

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {alineat} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {alineat} Cov (x, y) = ∑N (xn −xu) (yn −yu)

La fórmula per calcular la relació entre dues variables s’anomena covariància. Aquest càlcul us mostra la direcció de la relació. Si una variable augmenta i l’altra variable tendeix a augmentar també, la covariància seria positiva. Si una variable puja i l’altra tendeix a disminuir, la covariància seria negativa.

El nombre real que obteniu calculant això pot ser difícil d’interpretar perquè no està normalitzat. Una covariància de cinc, per exemple, es pot interpretar com una relació positiva, però només es pot dir que la força de la relació és més forta que si el nombre fos quatre o més dèbil que si el nombre fos sis.

Coeficient de correlació

Correlation = ρxy = Covxysxsy \ begin {align} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {align} Correlació = ρxy = sx sy Covxy

Cal estandarditzar la covariància per tal de permetre-la interpretar i utilitzar millor en la previsió, i el resultat és el càlcul de correlació. El càlcul de correlació només pren la covariància i la divideix pel producte de la desviació estàndard de les dues variables. Això unirà la correlació entre un valor de -1 i +1.

Una correlació de +1 es pot interpretar per suggerir que ambdues variables es mouen perfectament positivament entre si i una -1 implica que estan perfectament correlacionades negativament. En el nostre exemple anterior, si la correlació és +1 i el PIB augmenta un 1%, les vendes augmentarien un 1%. Si la correlació és -1, un augment del PIB de l'1% donaria lloc a una disminució de les vendes de l'1%, exactament al contrari.

Equació de regressió

Ara que sabem com es calcula la relació relativa entre les dues variables, podem desenvolupar una equació de regressió per predir o predir la variable que desitgem. A continuació es mostra la fórmula per a una regressió lineal simple. La "y" és el valor que intentem predir, la "b" és el pendent de la línia de regressió, la "x" és el valor del nostre valor independent i la "a" representa la intercepció y. L’equació de regressió simplement descriu la relació entre la variable dependent (y) i la variable independent (x).

y = bx + a \ begin {alineat} & y = bx + a \\ \ end {alineat} y = bx + a

L'intercepció, o "a", és el valor de y (variable dependent) si el valor de x (variable independent) és zero, i de vegades es coneix simplement com a "constant". Així, si no hi hagués cap canvi en el PIB, la vostra empresa encara faria vendes; aquest valor, quan el canvi del PIB és zero, és l’intercepte. Mireu el gràfic següent per veure una representació gràfica d’una equació de regressió. En aquest gràfic, només hi ha cinc punts de dades representats pels cinc punts del gràfic. La regressió lineal intenta estimar una línia que s’ajusta millor a les dades (una línia de millor ajustament) i l’equació d’aquesta línia dóna com a resultat l’equació de regressió.

Figura 1: Línia de millor ajustament

Font: Investopedia

Regressions a Excel

Ara que enteneu alguns dels antecedents que analitzen una regressió, fem un exemple senzill amb les eines de regressió d’Excel. Ens basarem en l’exemple anterior d’intentar preveure les vendes de l’any vinent en funció dels canvis del PIB. La següent taula mostra alguns punts de dades artificials, però aquests números poden ser fàcilment accessibles a la vida real.

CursVendesPIB
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Simplement, veient que hi haurà una correlació positiva entre vendes i PIB. Tots dos solen anar junts. Amb Excel, només cal que feu clic al menú desplegable Eines, seleccioneu Anàlisi de dades i, des d’allà, trieu Regressió . El quadre emergent és fàcil d'emplenar des d'allà; el vostre rang d'introducció Y és la vostra columna "Vendes" i el vostre rang d'entrada X és el canvi de la columna del PIB; escolliu l’interval de sortida per on voleu que es mostrin les dades al vostre full de càlcul i premeu OK. Hauríeu de veure alguna cosa semblant al que es mostra a la taula següent:

Coeficients estadístics de regressió

R múltiple0, 8292243Intercepte34.58409

Plaça R


0, 687613PIB88.15552
Ajustat
Plaça R


0.583484

-


-


Error comú51.021807-

-


Observacions5

-


-


Interpretació

Els principals resultats que us hauria de preocupar per a una regressió lineal simple són el quadrat R, la intercepció (constant) i el coeficient beta (b) del PIB. El nombre quadrat R en aquest exemple és del 68, 7%; això demostra el bé que el nostre model prediu o preveu les vendes futures, cosa que suggereix que les variables explicatives del model preveien el 68, 7% de la variació de la variable dependent. A continuació, tenim una interceptació de 34, 58, que ens diu que si es preveia que el canvi del PIB fos zero, les nostres vendes serien d’unes 35 unitats. I, finalment, el coeficient de correlació del PIB beta o 88, 15 ens indica que si el PIB augmenta l’1%, és probable que les vendes augmentin unes 88 unitats.

La línia de fons

Llavors, com faríeu servir aquest senzill model al vostre negoci ">

Per descomptat, es tracta d’una simple regressió i hi ha models que podeu crear que utilitzen diverses variables independents anomenades regressions lineals múltiples. Però les regressions lineals múltiples són més complicades i tenen diversos temes que necessitarien un altre article per discutir.

Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.
Recomanat
Deixa El Teu Comentari