Análisis de la varianza
En esta sección, aprenderemos una técnica conocida como análisis de varianza (a menudo abreviada ANOVA: analysis of variance), que permite probar la significancia de las diferencias entre más de dos medias muestrales. Usando el análisis de varianza, podremos hacer inferencias acerca de si nuestras muestras se tomaron de poblaciones que tienen la misma media.
El análisis de varianza será útil en situaciones tales como la comparación del kilometraje logrado por cinco clases diferentes de gasolina; la prueba de cuál de cuatro métodos de capacitación produce el aprendizaje más rápido; o en la comparación de los ingresos del primer año de los graduados de una media docena de escuelas de administración. En cada caso, se pueden comparar las medias de más de dos muestras.
Ejemplo de utilización de la ANOVA
El director de capacitación de una compañía está evaluando tres métodos de capacitación para empleados nuevos:
- El primero consiste en asignar un empleado nuevo a un trabajador experimentado para que éste le ayude en la fábrica;
- el segundo, en ubicar a todos los empleados nuevos en un salón de capacitación separado de la fábrica;
- el tercer método utiliza películas y materiales de aprendizaje programados.
El director de capacitación escoge al azar 16 empleados nuevos asignados al azar a los tres métodos, registra su producción diaria después de terminar los programas de capacitación:
Método 1 | Método 2 | Método 3 |
15 | 22 | 18 |
18 | 27 | 24 |
19 | 18 | 19 |
22 | 21 | 16 |
11 | 17 | 22 |
15 |
El director se pregunta si existen diferencias en la efectividad de los tres métodos, en un nivel de significancia de 0.01. Con las técnicas descritas en este capítulo, podemos ayudarle a responder esa pregunta.
Planteamiento de las hipótesis
En este caso, la razón para utilizar análisis de varianza es decidir si estas tres muestras (una muestra es el pequeño grupo de empleados capacitados por cualquier método) se tomaron de poblaciones (una población es el número total de empleados que pudieron ser capacitados por ese método) que tienen las mismas medias. Debido a que estamos probando la efectividad de los tres métodos de capacitación, debemos determinar si las tres muestras, representadas por las medias muestrales pudieron haberse tomado de poblaciones con la misma media, μ. Un planteamiento formal de las hipótesis nula y alternativa que deseamos probar sería:
Hipótesis nula:
Ho: μ1 = μ2 = μ3
Hipótesis alterna:
Ha: μ1, μ2 y μ3 no son todas iguales
Si las medias de las muestras no difieren significativamente, podemos inferir que la selección del método de capacitación no influye en la productividad del empleado. Por otro lado, si encontramos entre las medias muestrales diferencias demasiado grandes para atribuirlas al error de muestreo, podemos inferir que el método utilizado para capacitar a los trabajadores sí influye en su productividad.
Establecer el criterio de contraste
Como queremos determinar si la variación por los tratamientos es significativamente más grande que la variación por el error, entonces la prueba estadística adecuada es la distribución F. La distribución F es la razón entre dos varianzas:
Si localizamos este valor en la curva de la distribución F, la regla de decisión será aceptar la hipótesis nula si el estadístico de prueba ( F* ) es menor de 6.70, y aceptar la hipótesis alterna si el estadístico de prueba es mayor o igual a 6.70.
Estadístico de prueba
Como vimos anteriormente la distribución F es la razón entre dos varianzas:
Para calcular estas dos varianzas, utilizaremos las siguientes fórmulas:
Procedemos a calcular los estadísticos:
Sustituímos en las fórmulas:
Finalmente calculamos el estadístico de prueba, que representamos con F*:
Conclusión
Localizamos el estadístico de prueba F* en la curva, y observamos que queda localizado a la izquierda del criterio de contraste F=6.70, la zona de aceptación de Ho.
Por lo cual, la conclusión en nuestro problema debería ser: "No hay evidencia suficiente para afirmar que el desempeño de los empleados novatos es diferente según el método de capacitación utilizado".
Precauciones acerca del uso de la prueba F
Como se estableció, nuestros tamaños de muestra en este problema son demasiado pequeños para poder llegar a inferencias válidas con respecto a la efectividad de los métodos de capacitación. Escogimos muestras pequeñas para explicar la lógica del análisis de varianza sin tener que efectuar cálculos tediosos. En la práctica real, nuestra metodología sería la misma, pero las muestras serían más grandes.
En nuestro ejemplo, hemos supuesto la ausencia de muchos factores que podrían haber afectado nuestras conclusiones. Por ejemplo, aceptamos como un hecho que todos los empleados nuevos de la muestra demostraron la misma aptitud para el aprendizaje, lo cual puede ser o no cierto. Supusimos que todos los instructores de los tres métodos tienen la misma habilidad para enseñar y manejar a las personas, lo cual puede no ser cierto. Y supusimos que el personal de estadística de la compañía reunió los datos de productividad durante periodos de trabajo similares en cuanto a la hora del día, el día de la semana, la época del año, etc. Para poder tomar decisiones significativas basadas en el análisis de varianza, necesitamos tener la certeza de que todos los factores mencionados están controlados de manera efectiva.
Por último, note que solamente estudiamos el análisis de varianza en un sentido, o de un factor. El problema examinó el efecto del tipo de método de capacitación sobre la productividad de los empleados y nada más. Si deseáramos medir el efecto de dos factores, como el programa de capacitación y la edad del empleado, necesitaríamos usar análisis de varianza en dos sentidos.