Pagina principal Nuestra empresa Servicios de TyT Recursos y descargas Ejemplos de cálculo Links de interés Links de interés  
Español English
ANÁLISIS DE VARIANZA DE DOS FACTORES

Durante el tercer artículo titulado Análisis de varianza, desarrollamos un ejemplo, donde analizábamos el efecto de incluir diferentes niveles de harina de pescado en la dieta sobre la ganancia media diaria. Al final del artículo, nos preguntábamos que hubiera sucedido si hubiéramos alimentado a diez lechones con dos niveles diferentes de energía, manteniendo los niveles de harina de pescado. También dijimos que este problema se resolvía mediante un Análisis de varianza de dos factores. Antes de nada planteemos el problema cuyos datos son los siguientes:

G.M.D. Dieta 0% G.M.D. Dieta 4% G.M.D. Dieta 8%
2450 Mcal/kg EN 0.224 0.248 0.265
2450 Mcal/kg EN 0.211 0.240 0.187
2450 Mcal/kg EN 0.227 0.228 0.289
2450 Mcal/kg EN 0.228 0.266 0.250
2450 Mcal/kg EN 0.211 0.215 0.286
2450 Mcal/kg EN 0.213 0.304 0.198
2450 Mcal/kg EN 0.231 0.210 0.199
2450 Mcal/kg EN 0.202 0.215 0.275
2450 Mcal/kg EN 0.204 0.200 0.294
2450 Mcal/kg EN 0.195 0.258 0.277
2550 Mcal/kg EN 0.210 0.238 0.284
2550 Mcal/kg EN 0.248 0.247 0.200
2550 Mcal/kg EN 0.230 0.270 0.264
2550 Mcal/kg EN 0.239 0.290 0.235
2550 Mcal/kg EN 0.259 0.240 0.319
2550 Mcal/kg EN 0.231 0.262 0.273
2550 Mcal/kg EN 0.200 0.224 0.298
2550 Mcal/kg EN 0.243 0.257 0.299
2550 Mcal/kg EN 0.250 0.210 0.268
2550 Mcal/kg EN 0.235 0.265 0.221

Reconozcamos los dos factores con los que contamos. Por una parte, diferenciamos el factor contenido en harina de pescado que cuenta con tres niveles (0%, 4%, 8%) y veinte datos cada uno. Por otra parte, podemos diferenciar el factor nivel de energía de la dieta que cuenta con dos niveles (2450 Mcal/kg EN, 2550 Mcal/kg EN) y treinta datos cada uno. Que no se nos escape que los datos corresponden a la ganancia media diaria de los lechones.

Para resolver este ejemplo usaremos el programa Excel, como hemos hecho en todos los ejemplos. Más concretamente, utilizaremos la opción Análisis de datos del menú Herramientas. Dentro de esta opción, seleccionemos la opción Análisis de varianza de dos factores con varias muestras por grupo, como vemos en la siguiente figura:


Una vez realizada esta operación nos aparece el siguiente cuadro de diálogo:


Vayamos por partes. El rango de entrada nos da la oportunidad de seleccionar el rango de celdas que queremos analizar; sólo tenemos que arrastrar desde la primera celda superior izquierda hasta la última celda inferior derecha. Luego nos pide que le marquemos cuantas filas por muestra tenemos: en nuestro caso son 10, ya que los dos niveles de energía de la dieta cuentan con treinta muestras pero repartidas en los tres niveles de contenido de harina de pescado (diez por cada nivel). Si cada nivel de energía hubiese contado con sesenta muestras repartidas en tres niveles de harina de pescado, las filas por muestra hubiesen sido 20, por ejemplo. La opción Alfa es el nivel de significación, que es 0.05, a menos que lo deseemos cambiar. Por último, encontramos donde queremos que salgan los resultados, y en nuestro caso hemos optado por elegir que la salida sea en una hoja nueva. Una vez rellenadas todas las opciones, aceptamos y los resultados son los siguientes:

Análisis de varianza de dos factores con varias muestras por grupo
RESUMEN G.M.D. Dieta 0% G.M.D. Dieta 4% G.M.D. Dieta 8% Total
2450 Mcal/kg EN
Cuenta 10 10 10 30
Suma 2.146703245 2.384379683 2.520012571 7.051095499
Promedio 0.214670324 0.238437968 0.252001257 0.235036517
Varianza 0.000155978 0.00100845 0.001744236 0.001148949
2550 Mcal/kg EN
Cuenta 10 10 10 30
Suma 2.345242209 2.50381047 2.661560242 7.510612921
Promedio 0.234524221 0.250381047 0.266156024 0.250353764
Varianza 0.000326591 0.000542662 0.001407636 0.000879134
Total
Cuenta 20 20 20
Suma 4.491945454 4.888190153 5.181572813
Promedio 0.224597273 0.244409508 0.259078641
Varianza 0.000332316 0.000772273 0.001545718
ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de libertad
Promedio de los cuadrados
F
Probabilidad
Valor crítico
para F
Muestra
0.003519271
1
0.003519271
4.072009563
0.048579452
4.019540256
Columnas
0.011977819
2
0.00598891
6.929530776
0.002095172
3.16824611
Interacción
0.000166588
2
8.32939E-05
0.096376082
0.908278269
3.16824611
Dentro del grupo
0.046669987
54
0.000864259
Total
0.062333665
59

En la primera parte de los resultados, podemos observar que la opción Análisis de varianza de dos factores nos da un resumen, nivel a nivel, de los dos factores. Es decir, nos da el número de muestras, la suma, el promedio y la varianza (una medida de la desviación) para los tres niveles del factor harina de pescado en relación con los dos niveles del factor nivel de energía.

Vayamos al Análisis de varianza, que de hecho es lo que nos importa. La primera columna que nos interesa hace referencia al Origen de las variaciones, y son las diferentes fuentes de variación o interferencia en la variable que queremos estudiar, que no es otra que la ganancia media diaria de los lechones. El primer origen es la Muestra que corresponde al factor nivel de energía de la dieta que cuenta con dos niveles, de ahí que los grados de libertad sean 1 (recordemos que los grados de libertad acostumbran a ser el número de niveles menos uno, salvo casos especiales como veremos más adelante). El siguiente origen de las variaciones es las Columnas que corresponden al factor contenido en harina de pescado de la dieta, de esta manera los grados de libertad serán 2, debido a que este factor cuenta con tres niveles. La siguiente fuente de variación es la Interacción. Se conoce con el término interacción al comportamiento diferencial de un factor a según que niveles del otro; en nuestro ejemplo, un nivel de contenido de harina de pescado puede responder de un modo distinto según cuál sea el nivel de energía de la dieta (entendamos el término responder como valores distintos de ganancia media diaria). Los grados de libertad de la interacción entre los dos factores corresponden a la multiplicación de los grados de libertad de cada uno de los factores por separado. El último origen de variación es llamado Dentro del grupo y no es otra cosa que la variación fruto del azar. Los grados de libertad del azar se calculan de la siguiente forma; sumando los grados de libertad de los factores por separado y de la interacción , nos da como resultado 5. Luego debemos conocer los grados de libertad total, y corresponden al número de muestras totales (60) menos uno, como resultado 59 grados de libertad total. A continuación, si restamos los grados de libertad de los factores y la interacción, a los grados de libertad totales, el resultado serán los grados de libertad del azar, en nuestro caso 54.

Las columnas Suma de cuadrados y Promedio de los cuadrados se sitúan a nivel de cálculo del Análisis de varianza y se escapan a los objetivos de nuestros artículos, aunque son de indudable trascendencia. La única reseña a hacer de estas dos columnas es que dividiendo la suma de cuadrados entre los grados de libertad de cada origen de variación, nos da como resultado el promedio de los cuadrados. Y dividiendo cada promedio de los cuadrados de cada origen de variación entre el promedio de los cuadrados del azar, nos da el valor de la F de cada uno de los factores y de la interacción.

Hecha esta aclaración, pasemos a interpretar los resultados. Como dijimos en el artículo, valores altos de la F nos dan idea que podemos rechazar la hipótesis nula, que nos dice siempre que el factor que analizamos no influye en la variable respuesta. Observemos que la F del factor nivel de energía es 4.072, mientras que la F del factor contenido harina de pescado es de 6.929. La probabilidad de aceptar la hipótesis nula para el factor nivel de energía es baja (0.048) e inferior a 0.05, por tanto podemos aceptar como cierta la hipótesis alternativa, que nos dice que el factor nivel de energía influye en la ganancia media diaria. En el caso del factor contenido en harina de pescado, observemos que la probabilidad también es pequeña (0.002) y también es inferior a 0.05, por lo que podemos afirmar que el factor contenido en harina de pescado influye en la variable ganancia media diaria.

Por otro lado, observamos que el valor F de la interacción es bajo, y ya nos da una pequeña idea que la interacción de los factores no influye en la ganancia media diaria. Lo debemos confirmar mediante la probabilidad de aceptar la hipótesis nula que nos dice que no existe interacción entre los factores. Pues veamos que la probabilidad es elevada (0.908) y superior a 0.05, por lo que podemos afirmar que la interacción entre los distintos niveles del contenido de harina de pescado y los niveles de energía no existe y por tanto, no influye en la ganancia media diaria de los lechones.

La columna valor crítico de F, es una buena señal que no nos hayamos equivocado en nuestras interpretaciones. De este modo, si el valor crítico es superior a la F calculada, aceptamos la hipótesis nula. Mientras que si el valor crítico es inferior a la F calculada, rechazaríamos la hipótesis nula y aceptaríamos la alternativa, que nos dice que si que hay efecto.

El siguiente paso sería ver cual de los factores es superior, y lo haríamos comparando uno a uno cada factor. Como ya dijimos en el artículo, este paso se escaparía de los objetivos de los artículos, aunque una posible aproximación sería haciendo comparaciones entre medias de cada uno de los factores uno a uno, mediante pruebas T como hacíamos en artículo segundo.

 
Envíanos un mail
 
Desarrollado por Linza y Tecnomedia Digital Desarrollado por Linza y Tecnomedia Digital