Prova de T

Què és un test T?

Una prova t és un tipus d’estadística inferencial usada per determinar si hi ha una diferència significativa entre els mitjans de dos grups, que poden estar relacionats en determinades característiques. S'utilitza principalment quan els conjunts de dades, com el conjunt de dades registrat com el resultat de volar una moneda 100 vegades, seguirien una distribució normal i poden tenir variacions desconegudes. Un test t s’utilitza com a eina de prova d’hipòtesis, que permet la prova d’un supòsit aplicable a una població.

Un test t analitza l'estadística t, els valors de distribució t i els graus de llibertat per determinar la probabilitat de diferència entre dos conjunts de dades. Per realitzar un test amb tres o més variables, cal utilitzar una anàlisi de la variància.

1:38

Prova de T

Explicar la prova T

Essencialment, un test t ens permet comparar els valors mitjans dels dos conjunts de dades i determinar si provenien de la mateixa població. En els exemples anteriors, si prenguéssim una mostra d’alumnes de la classe A i una altra mostra d’estudiants de la classe B, no esperem que tinguessin exactament la mateixa mitjana i desviació estàndard. De la mateixa manera, les mostres preses del grup de control alimentat amb placebo i les preses del grup prescrit amb el medicament haurien de tenir una mitjana i una desviació estàndard lleugerament diferents.

Matemàticament, la prova t pren una mostra de cadascun dels dos conjunts i estableix la declaració del problema assumint una hipòtesi nul·la que els dos mitjans són iguals. A partir de les fórmules aplicables, es calculen i es comparen determinats valors en comparació amb els valors estàndards i s'accepta o es rebutja la hipòtesi nul·la assumida.

Si la hipòtesi nul·la es qualifica de ser rebutjada, indica que les lectures de dades són fortes i no són per casualitat. La prova t és només una de les moltes proves utilitzades per a aquest propòsit. Els estadístics han d'utilitzar addicionalment proves diferents de la prova t per examinar més variables i proves amb mides de mostra més grans. Per a una mida de mostra gran, els estadístics utilitzen una prova z. Altres opcions de prova inclouen la prova de chi-quadrat i la prova f.

Hi ha tres tipus de proves t, i es classifiquen en proves t dependents i independents.

Compres per emportar

Una prova t és un tipus d’estadística inferencial usada per determinar si hi ha una diferència significativa entre els mitjans de dos grups, que poden estar relacionats en determinades característiques.
El test t és una de moltes proves utilitzades per a la prova d’hipòtesis en estadístiques.
Per calcular una prova t necessita tres valors clau de dades. Inclouen la diferència entre els valors mitjans de cada conjunt de dades (anomenada diferència mitjana), la desviació estàndard de cada grup i el nombre de valors de dades de cada grup.
Hi ha diversos tipus de prova t que es poden realitzar depenent de les dades i el tipus d’anàlisi necessaris.

Resultats de proves ambigus

Penseu que un fabricant de medicaments vol provar un medicament recentment inventat. Segueix el procediment estàndard de provar el fàrmac en un grup de pacients i donar un placebo a un altre grup, anomenat grup control. El placebo que es dóna al grup control és una substància sense cap valor terapèutic previst i serveix com a punt de referència per mesurar com respon l’altre grup, al qual se li dóna el medicament real.

Després de l’assaig contra la droga, els membres del grup de control alimentat amb placebo van informar d’un augment de l’esperança de vida mitjana de tres anys, mentre que els membres del grup que se’ls prescriu el nou medicament reporten un augment de l’esperança de vida mitjana de quatre anys. L’observació instantània pot indicar que el fàrmac està funcionant, ja que els resultats són millors per al grup que l’utilitza. Tanmateix, també és possible que l'observació es pugui deure a l'ocasió, especialment a una sorprenent peça de sort. Un test t és útil per concloure si els resultats són realment correctes i aplicables a tota la població.

En una escola, 100 estudiants de la classe A van anotar una mitjana del 85% amb una desviació estàndard del 3%. Altres 100 estudiants de la classe B van obtenir una mitjana del 87% amb una desviació estàndard del 4%. Si bé la mitjana de la classe B és millor que la de la classe A, potser no és correcte saltar a la conclusió que el rendiment global dels estudiants de la classe B és millor que el dels estudiants de la classe A. Això és així perquè, juntament amb la la mitjana, la desviació estàndard de la classe B també és superior a la de la classe A. Indica que els seus percentatges extrems, als costats inferiors i superiors, estaven molt més repartits en comparació amb el de la classe A. Una prova t pot ajudar a determinar quina classe va sortir millor.

Supòsits de T-Test

El primer supòsit que es fa sobre proves t fa referència a l'escala de mesurament. El supòsit d’un test t és que l’escala de mesura aplicada a les dades recollides segueix una escala contínua o ordinal, com ara les puntuacions d’un test d’IQ.
El segon supòsit fet és el d’una mostra aleatòria simple, que les dades es recullen d’una part representativa, seleccionada aleatòriament, de la població total.
El tercer supòsit són les dades, quan es dibuixen, donen com a resultat una corba de distribució normal, amb forma de campana.
El quart supòsit és que s’utilitza una mida de mostra raonablement gran. La mida de la mostra més gran significa que la distribució dels resultats ha d'aproximar-se a una corba normal amb forma de campana.
L’assumpció final és l’homogeneïtat de la variància. Existeix una variació homogènia o igual quan les desviacions estàndard de les mostres són aproximadament iguals.

Càlcul de Tests

Per calcular una prova t necessita tres valors clau de dades. Inclouen la diferència entre els valors mitjans de cada conjunt de dades (anomenada diferència mitjana), la desviació estàndard de cada grup i el nombre de valors de dades de cada grup.

El resultat de la prova t produeix el valor t. Aquest valor t calculat es compara després amb un valor obtingut d'una taula de valors crítics (anomenada taula de distribució en T). Aquesta comparació ajuda a determinar quina probabilitat es produeix per casualitat la diferència entre els mitjans o si els conjunts de dades tenen realment diferències intrínseques. El test t pregunta sobre si la diferència entre els grups representa una veritable diferència en l'estudi o si és probable que sigui una diferència estadística sense sentit.

Taules de distribució de T

La taula de distribució en T està disponible en formats d'una cua i de dues cues. El primer s'utilitza per avaluar casos que tenen un valor fix o un rang amb una direcció clara (positiva o negativa). Per exemple, quina és la probabilitat de que el valor de sortida es mantingui per sota de -3, o que es superin més de set quan es tira un parell de daus? Aquest últim s’utilitza per a l’anàlisi de límit d’interval, com per exemple si es pregunta si les coordenades se situen entre -2 i +2.

Els càlculs es poden realitzar amb programes de programari estàndard que admeten les funcions estadístiques necessàries, com les que es troben a MS Excel.

T-Valors i graus de llibertat

La prova t produeix dos valors com a sortida: el valor t i els graus de llibertat. El valor t és una relació entre la diferència entre la mitjana dels dos conjunts de mostres i la diferència que hi ha dins dels conjunts de mostres. Si bé el valor del numerador (la diferència entre la mitjana dels dos conjunts d'exemple) és senzill de calcular, el denominador (la diferència que existeix dins dels conjunts de mostres) es pot complicar una mica segons el tipus de valors de dades implicats. El denominador de la relació és una mesura de la dispersió o de la variabilitat. Valors més alts del valor t, també anomenat t-score, indiquen que existeix una gran diferència entre els dos conjunts de mostres. Com més petit sigui el valor t, més semblança existeix entre els dos conjunts d'exemple.

Una puntuació t gran indica que els grups són diferents.
Una puntuació t petita indica que els grups són similars.

Els graus de llibertat es refereixen als valors en un estudi que té la llibertat de variar i que són essencials per avaluar la importància i la validesa de la nul·la hipòtesi. El càlcul d'aquests valors depèn generalment del nombre de registres de dades disponibles al conjunt de mostres.

T-Test correlacionat (o vinculat)

El test de correlació es realitza quan les mostres consisteixen normalment en parelles d'unitats similars o quan hi ha casos de mesures repetides. Per exemple, hi pot haver casos de mateixos pacients que s’estan provant repetidament, abans i després de rebre un tractament particular. En aquests casos, cada pacient s’utilitza com a mostra de control contra ells mateixos.

Aquest mètode també s'aplica als casos en què les mostres estan relacionades d'alguna manera o tenen característiques coincidents, com una anàlisi comparativa que implica nens, pares o germans. Les proves t correlacionades o aparellades són de tipus dependent, ja que es tracta de casos en què es relacionen els dos conjunts de mostres.

La fórmula per calcular el valor t i els graus de llibertat per a una prova t combinada és:

La mitjana1 i la mitjana2 són els valors mitjans de cadascun dels conjunts de mostres, mentre que var1 i var2 representen la variància de cadascun dels conjunts de mostres.

Els dos tipus restants pertanyen a les proves t independents. Les mostres d’aquest tipus es seleccionen independentment les unes de les altres, és a dir, els conjunts de dades dels dos grups no fan referència als mateixos valors. Inclouen casos com un grup de 100 pacients dividits en dos conjunts de 50 pacients cadascun. Un dels grups es converteix en el grup control i se li dóna un placebo, mentre que l’altre grup rep el tractament prescrit. Es tracta de dos grups de mostres independents que no estan separats entre ells.

Prova T amb variació igual (o agrupada)

La prova t igual a la variància s’utilitza quan el nombre de mostres de cada grup és el mateix, o la variància dels dos conjunts de dades és similar. La fórmula següent s'utilitza per calcular el valor t i els graus de llibertat per a prova de t de variància igual.

Valor T = mitjana1 − mitjana2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 on: mitjana1 i mitjana2 = Valors mitjans de cadascun dels conjunts de mostres1 i var2 = Varància de cadascun dels mostra setsn1 i n2 = Nombre de registres de cada conjunt de mostres \ begin {align} & \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { on:} \\ & mean1 \ text {i} mean2 = \ text {Valors mitjans de cadascun} \\ & \ text {dels conjunts de mostres} \\ & var1 \ text {i} var2 = \ text {Variació de cadascun dels conjunts d'exemple} \\ & n1 \ text {i} n2 = \ text {Nombre de registres de cada conjunt d'exemples} \\ \ end {alineat} Valor T = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 mitjana1 − mitjana2 on: mitjana1 i mitjana2 = Valors mitjans de cadascun dels conjunts de mostra1 i var2 = Varància de cadascun dels conjunts de mostra1 i n2 = Nombre de registres de cada mostra conjunt

Graus de llibertat = n1 + n2−2where: n1 i n2 = Nombre de registres de cada conjunt de mostres \ begin {align} & \ text {Graus of Freedom} = n1 + n2 - 2 \\ & \ textbf {on:} \\ & n1 \ text {i} n2 = \ text {Nombre de registres de cada conjunt de mostres} \\ \ end {align} Graus de llibertat = n1 + n2−2where: n1 i n2 = Nombre de registres de cada conjunt de mostres

T-Test de variància desigual

La prova t de variància desigual s’utilitza quan el nombre de mostres de cada grup és diferent i la variació dels dos conjunts de dades també és diferent. Aquesta prova també s’anomena prova t de Welch. La fórmula següent s'utilitza per calcular el valor t i els graus de llibertat per a un test de variància desigual:

Valor T = mitjana1 − mitjana2var12n1 + var22n2 a on: mitjana1 i mitjana2 = Valors mitjans de cadascun dels conjunts de mostra1 i var2 = Variació de cadascun dels exemples de conjunts1 i n2 = Nombre de registres de cada conjunt de mostres \ begin {align} i \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {on:} \ \ & mean1 \ text {i} mean2 = \ text {Valors mitjans de cadascun} \\ & \ text {dels conjunts de mostres} \\ & var1 \ text {i} var2 = \ text {Variació de cadascun dels conjunts de mostres} \ \ & n1 \ text {i} n2 = \ text {Nombre de registres de cada conjunt de mostres} \\ \ end {align} T-value = n1var12 + n2var22 mean1 − mean2 on: mean1 i mean2 = valors mitjans de cadascun dels exemples setsvar1 i var2 = Varància de cadascun dels exemples setsn1 i n2 = Nombre de registres de cada conjunt de mostres

Graus de llibertat = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2 -11: var1 i var2 = Varància de cadascun dels exemplars de mostresn1 i n2 = Nombre de registres de cada conjunt de mostres \ begin {alineat } & \ text {Graus of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {i} var2 = \ text {Variació de cadascun dels conjunts de mostres} \\ & n1 \ text {i} n2 = \ text {Nombre de registres de cada conjunt de mostres } \\ \ end {align} Graus de llibertat = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 on: var1 i var2 = Variança de cadascun de la mostra setsn1 i n2 = Nombre de registres en cada conjunt de mostres

Determinació de la prova T adequada

El següent diagrama de flux es pot utilitzar per determinar quin test t s'ha d'utilitzar en funció de les característiques dels conjunts de mostres. Els elements clau a considerar són si els registres de mostra són similars, el nombre de registres de dades de cada conjunt de mostres i la variància de cada conjunt de mostres.

Imatge de Julie Bang © Investopedia 2019

Exemple de prova de variància desigual

Suposem que prenem una mesura en diagonal de les pintures rebudes en una galeria d’art. Un grup de mostres inclou 10 pintures, mentre que l’altre inclou 20 pintures. Els conjunts de dades, amb els valors corresponents de mitjana i variació, són els següents:

	Conjunt 1	Conjunt 2
	19.7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23.3
	18, 5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19, 5	20.6
	21, 95	13.7
		23.2
		17, 5
		20.6
		18
		23.9
		21.6
		24.3
		20.4
		23.9
		13.3
Significar	19.4	21.6
Desacord	1.4	17.1

Tot i que la mitjana del conjunt 2 és superior a la del conjunt 1, no podem concloure que totes les pintures tinguin una longitud mitjana al voltant de 21, 6 unitats, ja que la variació del conjunt 2 és significativament superior a la set 1. És per casualitat o existeixen realment diferències. a la població total de totes les pintures rebudes a la galeria d'art ">

Com que el nombre de registres de dades és diferent (n1 = 10 i n2 = 20) i la variància també és diferent, es calcula el valor t i els graus de llibertat per al conjunt de dades anterior mitjançant la fórmula esmentada en el T-Test de variància desigual. secció

El valor t és -2.24787. Com que es pot ignorar el signe menys quan es comparen els dos valors t, el valor computat és 2.24787.

El valor de graus de llibertat és de 24, 38 i es redueix a 24, a causa de la definició de fórmula que requereix arrodonir el valor al mínim valor enter possible.

Sempre que s’assumeix una distribució normal, es pot especificar un nivell de probabilitat (nivell alfa, nivell de significació, p ) com a criteri d’acceptació. En la majoria dels casos, es pot suposar un valor del 5%.

Utilitzant el valor de llibertat com a 24 i un nivell de significació del 5%, una ullada a la taula de distribució de valors t ofereix un valor de 2, 064. Si es compara aquest valor amb el valor calculat de 2.247, s'indica que el valor t calculat és superior al valor de la taula a un nivell de significació del 5%. Per tant, és segur rebutjar la hipòtesi nul·la que no hi ha diferència entre mitjans. El conjunt poblacional té diferències intrínseques i no són per casualitat.

Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.

Termes relacionats

Funcionament de l'anàlisi de la variància (ANOVA) L'anàlisi de la variància (ANOVA) és una eina d'anàlisi estadística que separa la variabilitat total que es troba dins d'un conjunt de dades en dos components: factors aleatoris i sistemàtics. més Comprensió de la distribució T La distribució AT és un tipus de funció de probabilitat adequada per a estimar paràmetres de població per a tamanys petits o variències desconegudes. més Graus de llibertat Definició Els graus de llibertat fan referència al nombre màxim de valors lògicament independents, que són valors amb llibertat de variació, a la mostra de dades. més Funcionament de la desviació estàndard residual La desviació estàndard residual és un terme estadístic utilitzat per descriure la diferència en les desviacions estàndard dels valors observats enfront dels valors previstos, tal com es mostren els punts en una anàlisi de regressió. més Com funciona l'estadística del quadrat Chi Una estadística de chi quadrat (χ2) és una prova que mesura la comparació de les expectatives amb les dades reals observades (o els resultats del model). Les dades utilitzades per calcular una estadística quadrada de chi han de ser aleatòries, crues, mútuament exclusives, extretes de variables independents i extretes d’una mostra prou gran. més Com s'utilitza el test de Wilcoxon La prova Wilcoxon, que es refereix a la prova de la suma de rànquing o a la prova del rànquing signat, és una prova no paramètrica que compara dos grups emparellats. més Enllaços de socis

← Quines són les probabilitats de fer un comerç guanyador?

Fase d’anuitització →

Recomanat

Deixa El Teu Comentari