Durante el tercer artículo
titulado Análisis de varianza,
desarrollamos un ejemplo, donde analizábamos
el efecto de incluir diferentes niveles
de harina de pescado en la dieta sobre
la ganancia media diaria. Al final
del artículo, nos preguntábamos
que hubiera sucedido si hubiéramos
alimentado a diez lechones con dos
niveles diferentes de energía,
manteniendo los niveles de harina
de pescado. También dijimos
que este problema se resolvía
mediante un Análisis de varianza
de dos factores. Antes de nada planteemos
el problema cuyos datos son los siguientes:
|
|
|
G.M.D. Dieta 0% |
G.M.D. Dieta 4% |
G.M.D. Dieta 8% |
|
2450 Mcal/kg EN |
0.224 |
0.248 |
0.265 |
|
2450 Mcal/kg EN |
0.211 |
0.240 |
0.187 |
|
2450 Mcal/kg EN |
0.227 |
0.228 |
0.289 |
|
2450 Mcal/kg EN |
0.228 |
0.266 |
0.250 |
|
2450 Mcal/kg EN |
0.211 |
0.215 |
0.286 |
|
2450 Mcal/kg EN |
0.213 |
0.304 |
0.198 |
|
2450 Mcal/kg EN |
0.231 |
0.210 |
0.199 |
|
2450 Mcal/kg EN |
0.202 |
0.215 |
0.275 |
|
2450 Mcal/kg EN |
0.204 |
0.200 |
0.294 |
|
2450 Mcal/kg EN |
0.195 |
0.258 |
0.277 |
|
2550 Mcal/kg EN |
0.210 |
0.238 |
0.284 |
|
2550 Mcal/kg EN |
0.248 |
0.247 |
0.200 |
|
2550 Mcal/kg EN |
0.230 |
0.270 |
0.264 |
|
2550 Mcal/kg EN |
0.239 |
0.290 |
0.235 |
|
2550 Mcal/kg EN |
0.259 |
0.240 |
0.319 |
|
2550 Mcal/kg EN |
0.231 |
0.262 |
0.273 |
|
2550 Mcal/kg EN |
0.200 |
0.224 |
0.298 |
|
2550 Mcal/kg EN |
0.243 |
0.257 |
0.299 |
|
2550 Mcal/kg EN |
0.250 |
0.210 |
0.268 |
|
2550 Mcal/kg EN |
0.235 |
0.265 |
0.221 |
|
Reconozcamos los dos factores con
los que contamos. Por una parte, diferenciamos
el factor contenido en harina de pescado
que cuenta con tres niveles (0%, 4%,
8%) y veinte datos cada uno. Por otra
parte, podemos diferenciar el factor
nivel de energía de la dieta
que cuenta con dos niveles (2450 Mcal/kg
EN, 2550 Mcal/kg EN) y treinta datos
cada uno. Que no se nos escape que
los datos corresponden a la ganancia
media diaria de los lechones.
Para resolver este ejemplo usaremos
el programa Excel, como hemos hecho
en todos los ejemplos. Más
concretamente, utilizaremos la opción
Análisis de datos del menú
Herramientas. Dentro de esta opción,
seleccionemos la opción Análisis
de varianza de dos factores con varias
muestras por grupo, como vemos en
la siguiente figura: |
| |
Una vez realizada esta operación
nos aparece el siguiente cuadro de
diálogo: |
| |
Vayamos por partes. El rango de entrada
nos da la oportunidad de seleccionar
el rango de celdas que queremos analizar;
sólo tenemos que arrastrar
desde la primera celda superior izquierda
hasta la última celda inferior
derecha. Luego nos pide que le marquemos
cuantas filas por muestra tenemos:
en nuestro caso son 10, ya que los
dos niveles de energía de la
dieta cuentan con treinta muestras
pero repartidas en los tres niveles
de contenido de harina de pescado
(diez por cada nivel). Si cada nivel
de energía hubiese contado
con sesenta muestras repartidas en
tres niveles de harina de pescado,
las filas por muestra hubiesen sido
20, por ejemplo. La opción
Alfa es el nivel de significación,
que es 0.05, a menos que lo deseemos
cambiar. Por último, encontramos
donde queremos que salgan los resultados,
y en nuestro caso hemos optado por
elegir que la salida sea en una hoja
nueva. Una vez rellenadas todas las
opciones, aceptamos y los resultados
son los siguientes: |
|
Análisis de varianza de dos
factores con varias muestras
por grupo |
|
|
|
|
|
|
|
|
RESUMEN |
G.M.D. Dieta 0% |
G.M.D. Dieta 4% |
G.M.D. Dieta 8% |
Total |
|
| 2450
Mcal/kg EN |
|
|
|
|
|
|
Cuenta |
10 |
10 |
10 |
30 |
|
|
Suma |
2.146703245 |
2.384379683 |
2.520012571 |
7.051095499 |
|
|
Promedio |
0.214670324 |
0.238437968 |
0.252001257 |
0.235036517 |
|
|
Varianza |
0.000155978 |
0.00100845 |
0.001744236 |
0.001148949 |
|
|
|
|
|
|
|
|
| 2550
Mcal/kg EN |
|
|
|
|
|
|
Cuenta |
10 |
10 |
10 |
30 |
|
|
Suma |
2.345242209 |
2.50381047 |
2.661560242 |
7.510612921 |
|
|
Promedio |
0.234524221 |
0.250381047 |
0.266156024 |
0.250353764 |
|
|
Varianza |
0.000326591 |
0.000542662 |
0.001407636 |
0.000879134 |
|
|
|
|
|
|
|
|
| Total |
|
|
|
|
|
|
Cuenta |
20 |
20 |
20 |
|
|
|
Suma |
4.491945454 |
4.888190153 |
5.181572813 |
|
|
|
Promedio |
0.224597273 |
0.244409508 |
0.259078641 |
|
|
|
Varianza |
0.000332316 |
0.000772273 |
0.001545718 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ANÁLISIS DE VARIANZA |
|
|
|
| Origen
de las variaciones |
Suma de
cuadrados |
Grados de
libertad |
Promedio
de los cuadrados |
F |
Probabilidad |
Valor crítico
para F |
|
Muestra |
0.003519271 |
1 |
0.003519271 |
4.072009563 |
0.048579452 |
4.019540256 |
|
Columnas |
0.011977819 |
2 |
0.00598891 |
6.929530776 |
0.002095172 |
3.16824611 |
|
Interacción |
0.000166588 |
2 |
8.32939E-05 |
0.096376082 |
0.908278269 |
3.16824611 |
|
Dentro del grupo |
0.046669987 |
54 |
0.000864259 |
|
|
|
|
|
|
|
|
|
|
|
|
Total |
0.062333665 |
59 |
|
|
|
|
|
En la primera parte de los resultados,
podemos observar que la opción
Análisis de varianza de dos
factores nos da un resumen, nivel
a nivel, de los dos factores. Es decir,
nos da el número de muestras,
la suma, el promedio y la varianza
(una medida de la desviación)
para los tres niveles del factor harina
de pescado en relación con
los dos niveles del factor nivel de
energía.
Vayamos al Análisis de varianza,
que de hecho es lo que nos importa.
La primera columna que nos interesa
hace referencia al Origen de las variaciones,
y son las diferentes fuentes de variación
o interferencia en la variable que
queremos estudiar, que no es otra
que la ganancia media diaria de los
lechones. El primer origen es la Muestra
que corresponde al factor nivel de
energía de la dieta que cuenta
con dos niveles, de ahí que
los grados de libertad sean 1 (recordemos
que los grados de libertad acostumbran
a ser el número de niveles
menos uno, salvo casos especiales
como veremos más adelante).
El siguiente origen de las variaciones
es las Columnas que corresponden al
factor contenido en harina de pescado
de la dieta, de esta manera los grados
de libertad serán 2, debido
a que este factor cuenta con tres
niveles. La siguiente fuente de variación
es la Interacción. Se conoce
con el término interacción
al comportamiento diferencial de un
factor a según que niveles
del otro; en nuestro ejemplo, un nivel
de contenido de harina de pescado
puede responder de un modo distinto
según cuál sea el nivel
de energía de la dieta (entendamos
el término responder como valores
distintos de ganancia media diaria).
Los grados de libertad de la interacción
entre los dos factores corresponden
a la multiplicación de los
grados de libertad de cada uno de
los factores por separado. El último
origen de variación es llamado
Dentro del grupo y no es otra cosa
que la variación fruto del
azar. Los grados de libertad del azar
se calculan de la siguiente forma;
sumando los grados de libertad de
los factores por separado y de la
interacción , nos da como resultado
5. Luego debemos conocer los grados
de libertad total, y corresponden
al número de muestras totales
(60) menos uno, como resultado 59
grados de libertad total. A continuación,
si restamos los grados de libertad
de los factores y la interacción,
a los grados de libertad totales,
el resultado serán los grados
de libertad del azar, en nuestro caso
54.
Las columnas Suma de cuadrados y Promedio
de los cuadrados se sitúan
a nivel de cálculo del Análisis
de varianza y se escapan a los objetivos
de nuestros artículos, aunque
son de indudable trascendencia. La
única reseña a hacer
de estas dos columnas es que dividiendo
la suma de cuadrados entre los grados
de libertad de cada origen de variación,
nos da como resultado el promedio
de los cuadrados. Y dividiendo cada
promedio de los cuadrados de cada
origen de variación entre el
promedio de los cuadrados del azar,
nos da el valor de la F de cada uno
de los factores y de la interacción.
Hecha esta aclaración, pasemos
a interpretar los resultados. Como
dijimos en el artículo, valores
altos de la F nos dan idea que podemos
rechazar la hipótesis nula,
que nos dice siempre que el factor
que analizamos no influye en la variable
respuesta. Observemos que la F del
factor nivel de energía es
4.072, mientras que la F del factor
contenido harina de pescado es de
6.929. La probabilidad de aceptar
la hipótesis nula para el factor
nivel de energía es baja (0.048)
e inferior a 0.05, por tanto podemos
aceptar como cierta la hipótesis
alternativa, que nos dice que el factor
nivel de energía influye en
la ganancia media diaria. En el caso
del factor contenido en harina de
pescado, observemos que la probabilidad
también es pequeña (0.002)
y también es inferior a 0.05,
por lo que podemos afirmar que el
factor contenido en harina de pescado
influye en la variable ganancia media
diaria.
Por otro lado, observamos que el valor
F de la interacción es bajo,
y ya nos da una pequeña idea
que la interacción de los factores
no influye en la ganancia media diaria.
Lo debemos confirmar mediante la probabilidad
de aceptar la hipótesis nula
que nos dice que no existe interacción
entre los factores. Pues veamos que
la probabilidad es elevada (0.908)
y superior a 0.05, por lo que podemos
afirmar que la interacción
entre los distintos niveles del contenido
de harina de pescado y los niveles
de energía no existe y por
tanto, no influye en la ganancia media
diaria de los lechones.
La columna valor crítico de
F, es una buena señal que no
nos hayamos equivocado en nuestras
interpretaciones. De este modo, si
el valor crítico es superior
a la F calculada, aceptamos la hipótesis
nula. Mientras que si el valor crítico
es inferior a la F calculada, rechazaríamos
la hipótesis nula y aceptaríamos
la alternativa, que nos dice que si
que hay efecto.
El siguiente paso sería ver
cual de los factores es superior,
y lo haríamos comparando uno
a uno cada factor. Como ya dijimos
en el artículo, este paso se
escaparía de los objetivos
de los artículos, aunque una
posible aproximación sería
haciendo comparaciones entre medias
de cada uno de los factores uno a
uno, mediante pruebas T como hacíamos
en artículo segundo.
|
| |