Home Our company T&T Services Resources and downloads Applied statistics collaborations Interest links
Español English
Ejercicio a resolver CAPITULO II. PRUEBA t
Para resolver este problema usaremos el programa Excel, como ya tenemos acostumbrado. Los datos del ejercicio son los siguientes:

Dieta nueva
Dieta antigua
53
50
53
49
40
49
35
45
35
44
33
44
32
41
30
40
20
39
17
39
16
32
10
27
9
22
4
21
4
15
3
11




En primer lugar nos piden que calculemos la media y la desviación de las dos muestras que tenemos. Para ello, buscaremos en el menú Herramientas la opción Análisis de datos. Una vez desplegado el cuadro clicaremos en Estadística descriptiva. Esta forma de calcular la media y la desviación no se ha explicado en la serie de artículos, pero creemos de sumo interés que se conozcan la mayor parte de las opciones que presenta el programa Excel. El menú que se desplegará es el siguiente: Deberemos repetir la operación tanto para la Dieta nueva como para la antigua. De esta forma los resultados que obtendremos son los siguientes:

Dieta nueva Dieta antigua
Media 24.625 Media 35.5
Error típico 4.156195175 Error típico 3.1503968
Mediana 25 Mediana 39.5
Moda 53 Moda 49
Desviación estándar 16.6247807 Desviación estándar 12.6015872
Varianza de la muestra 276.3833333 Varianza de la muestra 158.8
Curtosis -0.996341323 Curtosis -0.743396041
Coeficiente de asimetría 0.280512002 Coeficiente de asimetría -0.72678862
Rango 50 Rango 39
Mínimo 3 Mínimo 11
Máximo 53 Máximo 50
Suma 394 Suma 568
Cuenta 16 Cuenta 16
Nivel de confianza(95.0%) 8.858725763 Nivel de confianza(95.0%) 6.714915956


Lo primero que destaca es que la media de la dieta nueva es inferior a la media de la dieta antigua. Es peligroso empezar a hacer sentencias definitivas viendo este detalle, pero nos da una primera idea acerca de las dos medias; como se ha dicho en el artículo, nos deberíamos preguntar si esta diferencia entre las dos medias es significativa, pero no adelantemos acontecimientos. Por lo que respecta a la desviación, observemos que es inferior en la dieta antigua. Esto nos hace pensar que los datos de la dieta antigua están menos dispersos, es decir, se encuentran más cercanos a la media en el caso de la dieta antigua, que en el caso de la dieta nueva. ¿Podemos extraer alguna conclusión definitiva? En absoluto, pero ya nos podemos hacer una idea de cómo irán los tiros, hablando llanamente.

Resolvamos los siguientes apartados. Para ello volvamos a recurrir al menú Herramientas, dentro del cuál encontraremos de nuevo la opción Análisis de datos. Cliquemos la opción Prueba t para dos muestras suponiendo varianzas desiguales.



La pregunta que se nos plantea es si existen diferencias entre las dos dietas. Como ya hemos comentado anteriormente, a simple vista si que se intuían diferencias pero no podíamos saber si éstas eran estadísticamente significativas. El test que planteamos es el sigiuiente:


Hipótesis nula Þ Ho : m 1 - m 2 = 0, es decir, m 1 = m 2


Hipótesis alternativa Þ Ha : m 1 - m 2 ¹ 0, es decir, : m 1 ¹ m 2,

Donde m 1 representa la media de la población alimentada con la dieta nueva, y m 2 representa la media de la población alimentada con la dieta antigua. Si el resultado del test diese la razón a la hipótesis nula, podríamos concluir que no diferencias entre las dos dietas; mientras que si el resultado diese la razón a la hipótesis alternativa, podríamos concluir que no existen diferencias entre una y otra dieta, tal como habíamos intuido en el apartado anterior. Con el test que planteamos despejaremos la duda que se nos ha planteado, veamos el resultado de la prueba t:

Prueba t para dos muestras suponiendo varianzas desiguales

Dieta nueva

Dieta antigua

Media

24.625

35.5

Varianza

276.3833333

158.8

Observaciones

16

16

Diferencia hipotética de las medias

0

Grados de libertad

28

Estadístico t

-2.085225992

P(T<=t) una cola

0.023142021

Valor crítico de t (una cola)

1.701130259

P(T<=t) dos colas

0.046284042

Valor crítico de t (dos colas)

2.048409442


Primero de todo, nótese que el número de observaciones es 16, que son el número de datos con el que contamos. En segundo lugar, observar que el valor que adopta el estadístico es

-2.085. Ahora vayamos por partes. Tenemos la solución para un test de una cola, y la solución de un test de dos colas.

La solución para un test de dos colas nos diría si hay diferencias entre las dos dietas, que es, en principio, lo que nos preguntábamos. Veamos que ocurre. La región crítica está comprendida entre 2.048 y –2.048, aunque no nos lo digan. El significado de la región crítica es la siguiente: cualquier valor del estadístico que se sitúe en esta región, validará la hipótesis nula. Ya que el valor de nuestro estadístico es –2.085, fuera de la región crítica, descartamos como cierta la hipótesis nula y aceptamos como cierta la hipótesis alternativa, que nos dice que las dos dietas no son iguales. Tener presente que el nivel de significación es de 0.05, es decir, con una probabilidad de 0.05 nos podremos equivocar al extraer cualquier conclusión que extraigamos.

Muy bien, nuestra intuición no nos ha engañado y efectivamente no eran iguales las dos dietas. Ahora sería magnífico saber si una de las dos dietas es mejor que la otra. Esta pregunta la podremos resolver con el test de una cola, de la siguiente forma:

Si m 1 representa la media de la población alimentada con la dieta nueva, y m 2 representa la media de la población alimentada con la dieta antigua, podemos tener que:


Hipótesis nula Þ Ho : m 1 - m 2 <= 0


Hipótesis alternativa Þ Ha : m 1 - m 2 > 0,

es decir, la dieta nueva (representada por m 1) es mejor que la dieta antigua (representada por m 2). O puede darse el siguiente caso:


Hipótesis nula Þ Ho : m 1 - m 2 >= 0


Hipótesis alternativa Þ Ha : m 1 - m 2 < 0,

Es decir, la dieta nueva no aporta nada que no aporte la dieta antigua. Aunque parezca un trabalenguas no lo es. La clave está en la hipótesis alternativa. Si la resta m 1 - m 2 es superior a cero quiere decir que m 1(media de la dieta nueva) es superior a m 2 (media de la dieta antigua). Si es inferior a cero, la dieta nueva no será superior a la dieta antigua.

Planteemos uno de los dos tests, por ejemplo el primero:


Hipótesis nula Þ Ho : m 1 - m 2 <= 0


Hipótesis alternativa Þ Ha : m 1 - m 2 > 0

Ya hemos comprobado que las dos dietas son diferentes. Si el test que planteamos ahora nos indica que la hipótesis correcta es la alternativa, podremos concluir que la dieta nueva mejora la calidad de la leche; si el resultado nos dice que la hipótesis correcta es la nula, concluiremos que la dieta nueva no mejora la calidad de la leche.

El valor crítico ahora es 1.701, por tanto la región crítica es la forma por 1.701 y todos los números inferiores a éste hasta -¥ . El valor del estadístico continúa siendo –2.085. Por tanto se sitúa dentro de la región crítica, que es la región de aceptación de la hipótesis nula, que nos dice que la dieta nueva no mejora la calidad de la leche. Las impresiones que tuvimos al iniciar el problema se han cumplido por esta vez, pero no siempre nos encontraremos con ejemplos tan claros.


Envíanos un mail
 
 
Desarrollado por Linza y Tecnomedia Digital Desarrollado por Linza y Tecnomedia Digital