Correlació espuriosa
Quina és la correlació espurnaEn estadístiques, una correlació espuriosa o espurietat es refereix a una connexió entre dues variables que sembla causal però no ho és. Les relacions espurioses solen aparèixer una variable que afecta a una altra. Aquesta correlació espuriosa és sovint causada per un tercer factor que no és evident en el moment de l'examen, de vegades anomenat factor confús.
Compres per emportar
- La correlació espuriosa o espurietat és quan apareixen dos factors relacionats casualment però no ho són.
- L’aparició d’una relació causal sovint es deu a un moviment similar en un gràfic que resulta coincident o causat per un tercer factor “confús”.
- La correlació espuriosa sovint pot ser causada per petites mides de mostra o per punts extrems arbitraris.
Com funciona la correlació espuriosa
Quan dues variables aleatòries es fan un seguiment estret d’un gràfic, és fàcil sospitar de la correlació o d’una relació entre els dos factors, on un canvi afecta l’altre. Deixant de banda la "causalitat", un altre tema, aquesta observació pot portar al lector del gràfic a creure que el moviment de la variable A està lligat al moviment de la variable B o viceversa. però, de vegades, després d’un examen estadístic més proper, els moviments alineats són coincidents o causats per un tercer factor que afecta els primers dos. Aquesta és una correlació espuriosa. La investigació feta amb mides de mostra petites o amb efectes arbitraris és particularitat susceptible d’espurietat.
Exemple de correlacions espurioses
No és massa difícil descobrir correlacions interessants. Tanmateix, molts resultaran espuriosos. Per a l’espècie masculina de Wall Street, dues correlacions espúries populars inclouen dones i esports. A partir dels anys vint, la teoria de la longitud de la faldilla és la que estableix una correlació entre les longituds de la falda i la direcció del mercat de valors. Si la durada de les faldilles és llarga, això vol dir que el mercat de valors està a la baixa; si són curts, el mercat augmentarà. A finals de gener es parla de l’anomenat indicador de Super Bowl, que suggereix que una victòria per part de l’equip AFC significa que el mercat borsari baixarà durant l’any que ve, mentre que una victòria de l’equip NFC suposa un augment de la mercat Des de 1966, l’indicador ha tingut una taxa de precisió del 80%. És una divertida peça de conversa, però probablement no és una cosa que un assessor financer seriós recomanaria com a estratègia d'inversió per als clients.
Aquests són alguns exemples més de correlacions espurials comunes:
- Els ofegaments augmenten quan augmenten les vendes de gelats. Pot semblar que l'augment de les vendes de gelats causa més ofegament, però en realitat, l'augment de la calor pot provocar la natació de més persones, a més de comprar més gelats.
- La taxa d’assassinat als Estats Units del 2006-2011 es va reduir al mateix ritme que l’ús de Microsoft Internet Explorer.
- Els executius que diuen si us plau i gràcies més sovint gaudeixen d’un millor rendiment compartit.
- Les persones que porten equips d’equips d’Oirland Raiders tenen més probabilitats de cometre delictes.
Com detectar correlacions espores
Els estadístics i altres científics que analitzen les dades han d'estar vigilants durant tot el temps. Hi ha nombrosos mètodes que utilitzen, entre ells:
- Assegurar una mostra representativa adequada.
- Obtenció d'una mida de mostra adequada.
- Desconfiar dels punts finals arbitraris.
- Controlar la major quantitat possible de variables externes.
- Utilitzant una hipòtesi nul·la i comprovant un fort valor p.