MEDIDAS DE VARIABILIDAD

En la mayor parte de las series de datos, los valores no son todos iguales. El grado en que varían es de de gran importancia en la Estadística, como lo ilustran los siguientes ejemplos:

En una clínica se toma la presión tres veces al día a los pacientes. Al final del día, las lecturas de doña Concha fueron 120/80, 118/78, 122/82 mmHg, mientras que los registros de don Pancho son: 150/100, 120/80, 90/60 mmHg. La presión promedio es la misma en los dos pacientes, 120/80 mmHg, pero como podemos ver, los registros de doña Concha son bastante estables, es decir tienen una variabilidad baja. Mientras que, don Pancho tiene una presión muy variable.

Los minutos jugados por dos futbolistas novatos en sus últimos 5 juegos fueron los siguientes. Casimiro Peronó jugó 30, 20, 10, 35, 5 minutos; y Aquiles Boy participó 22, 20, 19, 18, 21 minutos. En cinco juegos los dos jugadores vieron acción un promedio de 20 minutos, pero Casimiro es muy variable en la cantidad de minutos que juega, mientras que con Aquiles la variación es menor.

La medición de la variabilidad es muy importante en la inferencia estadística. Supongamos que se lanza al aire una moneda 100 veces, y en 70 veces el resultado fue "cara", ¿habría razón para suponer que la moneda no es "legal", es decir, que está trucada para favorecer que el resultado del lanzamiento sea cara? Para saberlo tendríamos que comparar la variación de las veces que cae "cara" en 100 lanzamientos con otra moneda similar.

Necesitamos valorar el grado en que los datos están dispersos; las medidas que nos proporcionarán esta información son las "medidas de variabilidad" o también llamadas "medidas de dispersión".

Las medidas de variabilidad son un conjunto de estadísticos que cuantifican que tan variables, o que tan dispersas, tienden a ser las puntuaciones de una serie de datos.


Verificar si las puntuaciones varían mucho, o si tienen valores similares es en ocasiones la cuestión central en una investigación. La variabilidad es un concepto cuantitativo, de modo que nada de esto se aplica a las distribuciones de datos cualitativos.

Razones para estudiar la variabilidad

Hay varias razones para analizar la variabilidad en una serie de datos.

1. Podemos evaluar la medida de tendencia central utilizada.

Una medida de variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de la media. La media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una gran medida de variabilidad indica que la media no es muy representativa de los datos.

2. Comparar cómo están esparcidos los datos en dos o más distribuciones.

Como vimos antes, al comparar dos series de datos, el promedio no es lo único importante, porque tal vez se tenga el mismo promedio, pero su variabilidad sea muy distinta. Pongamos otro ejemplo, la calificación promedio de dos estudiantes, A = {80, 80, 85, 75 } y B = {90, 55, 85, 90 }, es de 80. Basados en esto podríamos pensar que sus calificaciones son iguales. Pero si revisamos el detalle de sus calificaciones vemos que las calificaciones del estudiante A varían poco en relación al promedio, y que las del estudiante B se encuentran más dispersas. Esta dispersión es lo que nos cuantifican las medidas de variabilidad.

Medidas de variabilidad más utilizadas

Hay muchas medidas de variabilidad intuitivamente atractivas, pero poco utilizadas, como el rango, la desviación media y la desviación cuartilar. De lejos, las medidas de variabilidad más ampliamente utilizadas son las que tienen que ver con cómo extender los resultados a partir de la media. Estas son la desviación estándar (s o σ), y la varianza (s² o σ2).

No hay comentarios: