Suma de quadrats
Què és la suma dels quadrats?La suma de quadrats és una tècnica estadística utilitzada en l'anàlisi de regressió per determinar la dispersió de punts de dades. En una anàlisi de regressió, l’objectiu és determinar el bé que es pot ajustar una sèrie de dades a una funció que pot ajudar a explicar com es va generar la sèrie de dades. La suma de quadrats s’utilitza com a forma matemàtica per trobar la funció que s’adapta millor (varia menys) a partir de les dades.
La fórmula per a la suma dels quadrats és
Per a un conjunt X de n ítems: suma de quadrats = ∑i = 0n (Xi − X‾) 2 on: Xi = El ith ítem del conjuntX‾ = La mitjana de tots els ítems del conjunt (Xi − X‾) = La desviació de cada element de la mitjana \ begin {align} & \ text {Per a un conjunt} X \ text {de} n \ text {items:} \\ & \ text {Suma de quadrats} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {on:} \\ & X_i = \ text {The} i ^ {th} \ text {item in the set} \\ & \ overline {X} = \ text {La mitjana de tots els articles del conjunt} \\ & \ left (X_i- \ overline {X} \ right) = \ text {La desviació de cada element de la mitjana} \\ \ end {alineat} Per a un conjunt X de n ítems: Suma de quadrats = i = 0∑n (Xi −X) 2undeu: Xi = El ith del conjunt set = La mitjana de tots ítems del conjunt (Xi −X) = La desviació de cada element de la mitjana
La suma dels quadrats també es coneix com a variació.
Què et diu la suma dels quadrats?
La suma dels quadrats és una mesura de la desviació de la mitjana. En estadístiques, la mitjana és la mitjana d’un conjunt de nombres i és la mesura més utilitzada de tendència central. La mitjana aritmètica es calcula simplement sumant els valors del conjunt de dades i dividint pel nombre de valors.
Diguem que els preus de tancament de Microsoft (MSFT) en els darrers cinc dies van ser de 74, 01, 74, 77, 73, 94, 73, 61 i 73, 40 en dòlars americans. La suma dels preus totals és de 369, 73 dòlars i el preu mitjà o mitjà del llibre de text seria, per tant, 369, 73 USD / 5 = 73, 95 dòlars.
Però no sempre és suficient conèixer la mitjana d’un conjunt de mesuraments. De vegades, és útil saber quanta variació hi ha en un conjunt de mesures. A quina distància es diferencien els valors individuals de la mitjana pot donar una visió detallada de com s’adeqüen a les observacions o valors al model de regressió que es crea.
Per exemple, si un analista volia saber si el preu de les accions de MSFT es mou en conjunt amb el preu d’Apple (AAPL), pot enumerar el conjunt d’observacions del procés d’ambdues existències durant un període determinat, per exemple, 1, 2., o 10 anys, i creeu un model lineal amb cadascuna de les observacions o mesures registrades. Si la relació entre ambdues variables (és a dir, el preu d’AAPL i el preu de MSFT) no és una línia recta, hi ha variacions en el conjunt de dades que cal examinar.
En estadístiques es parla, si la línia del model lineal creat no passa per totes les mesures del valor, aleshores una part de la variabilitat que s’ha observat en els preus de les accions no s’explica. La suma de quadrats s'utilitza per calcular si existeix una relació lineal entre dues variables, i qualsevol variació no explicada es coneix com la suma residual de quadrats.
La suma dels quadrats és la suma del quadrat de variació, on la variació es defineix com la distribució entre cada valor individual i la mitjana. Per determinar la suma de quadrats, es quadra la distància entre cada punt de dades i la línia de millor adaptació i es resumeix a continuació. La línia de millor ajustat minimitzarà aquest valor.
Com calcular la suma dels quadrats
Ara podeu veure per què la mesura s’anomena suma de desviacions quadrades o la suma de quadrats per escurçar. Utilitzant el nostre exemple MSFT anterior, la suma de quadrats es pot calcular com:
- SS = (74.01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
- SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
- SS = 1.0942
Si s’afegeix la suma de les desviacions soles sense quadrar, es produirà un nombre igual o proper a zero, ja que les desviacions negatives compensaran gairebé perfectament les desviacions positives. Per obtenir un nombre més realista, cal calcular la suma de les desviacions. La suma dels quadrats sempre serà un nombre positiu perquè el quadrat de qualsevol nombre, sigui positiu o negatiu, sempre és positiu.
Exemple de com utilitzar la suma de quadrats
A partir dels resultats del càlcul MSFT, una suma elevada de quadrats indica que la majoria dels valors estan més lluny de la mitjana i, per tant, hi ha una gran variabilitat en les dades. Una suma baixa de quadrats fa referència a una baixa variabilitat en el conjunt d’observacions.
A l'exemple anterior, 1.0942 mostra que la variabilitat del preu de les accions de MSFT en els últims cinc dies és molt baixa i els inversors que busquen invertir en accions caracteritzades per estabilitat de preus i baixa volatilitat poden optar per MSFT.
Compres per emportar
- La suma de quadrats mesura la desviació de punts de dades respecte al valor mitjà.
- Un resultat de suma de quadrats més gran indica un gran grau de variabilitat dins del conjunt de dades, mentre que un resultat inferior indica que les dades varien considerablement del valor mitjà.
Limitacions de l'ús de la suma dels quadrats
Per prendre una decisió d’inversió sobre quines accions es necessiten moltes més observacions que les que s’enumeren aquí. Pot ser que un analista hagi de treballar amb anys de dades per saber amb més seguretat la variabilitat d’un actiu alt o baixa. A mesura que s’afegeixen més punts de conjunt al conjunt, la suma de quadrats es farà més gran a mesura que els valors s’estendran més.
Les mesures de variació més utilitzades són la desviació estàndard i la variància. Tanmateix, per calcular qualsevol de les dues mètriques, primer cal calcular la suma dels quadrats. La variància és la mitjana de la suma dels quadrats (és a dir, la suma dels quadrats dividida pel nombre d’observacions). La desviació estàndard és l’arrel quadrada de la variància.
Hi ha dos mètodes d’anàlisi de regressió que utilitzen la suma de quadrats: el mètode lineal de mínims quadrats i el mètode no lineal de mínims quadrats. El mètode de menys quadrats es refereix al fet que la funció de regressió minimitza la suma dels quadrats de la variància dels punts de dades reals. D’aquesta manera, és possible dibuixar una funció que proporciona estadísticament el millor ajustament per a les dades. Tingueu en compte que una funció de regressió pot ser lineal (una línia recta) o no lineal (una línia de corba).
Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.