LA VARIANZA Y LA DESVIACIÓN ESTÁNDAR
La varianza y la desviación estándar son índices numéricos que cuantifican la variabilidad de una serie de datos, midiendo su dispersión alrededor de la media. Una varianza o una desviación estándar baja indican que los datos de una serie se encuentran bastante cercanos a la media aritmética (promedio), por el contrario, una varianza o desviación estándar alta nos dicen que los datos se encuentran dispersos en relación a la media.
La varianza es la media aritmética de las desviaciones cuadradas de los datos respecto a la media.
La desviación estándar es la raíz cuadrada de la varianza.
Aunque la varianza es un estadístico importante que se utiliza en algunos métodos estadísticos relevantes, tiene una gran desventaja frente a la desviación estándar: las unidades de la varianza son diferentes de las unidades del conjunto original de datos. Por ejemplo, si las edades de los asistentes a un concierto están dadas en años, las unidades de varianza están dadas en años cuadrados. ¿Qué es un año cuadrado? Como la varianza utiliza unidades distintas, es sumamente difícil comprenderla si la relacionamos con el conjunto original de datos, lo que no pasa con la desviación estándar. Por esta propiedad, cuando tratemos de comprender la dispersión de los datos nos enfocaremos en la desviación estándar.
Varianza y Desviación Estándar para datos no agrupados
Tanto la notación como la fórmula de la varianza de una población y la de una muestra son ligeramente diferentes. En una población se acostumbra representar a la varianza con una letra sigma (σ) minúscula elevada al cuadrado, mientras que en las muestras con una letra "s" al cuadrado. Las fórmulas son:
Varianza de una población. |
Varianza de una muestra. |
Las desviaciones estándar de la población y muestra se calculan simplemente sacando la raíz cuadrada a la respectiva varianza, y su notación con las letras "σ" y "s" sin cuadrado:
Desviación estándar de una población. |
Desviación estándar de una muestra. |
Ejemplo
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la varianza y la desviación estándar de las observaciones muestreadas?
X | X² | ||
85.4 | 7293.16 | ||
85.3 | 7276.09 | ||
84.9 | 7208.01 | ||
85.4 | 7293.16 | ||
84.0 | 7056.00 | ||
ΣX= | 425.0 | ΣX²= | 36126.42 |
Varianza y Desviación Estándar para datos agrupados
Si los datos están agrupados en una distribución de frecuencia, la varianza y la desviación estándar de la muestra se pueden aproximar sustituyendo ΣFX² en lugar de ΣX² y ΣFX en vez de ΣX. Las fórmulas quedarían de la siguiente manera:
Varianza de una población. |
Varianza de una muestra. |
Mientras que las fórmulas de la desviación estándar para datos agrupados permanece sin modificación.
Desviación estándar de una población. |
Desviación estándar de una muestra. |
Ejemplo:
Calcular la varianza y la desviación estándar de la siguiente distribución de frecuencia de las edades de un grupo de 40 asistentes a un concierto. Como vemos es la tabla de frecuencias que elaboramos en la sección relativa a las tablas de frecuencias.
Edades | Número de personas |
15 - 19 | 2 |
20 - 24 | 1 |
25 - 29 | 4 |
30 - 34 | 15 |
35 - 39 | 10 |
40 - 44 | 5 |
45 - 49 | 3 |
Primeramente, calculamos la marca de clase, para después calcular los productos FX y FX² para proceder finalmente a calcular las sumatorias ΣFX y ΣFX² y aplicar las fórmulas.
LI | LS | X | F | FX | FX² |
15 | 19 | 17 | 2 | 34 | 578 |
20 | 24 | 22 | 1 | 22 | 484 |
25 | 29 | 27 | 4 | 108 | 2916 |
30 | 34 | 32 | 15 | 480 | 15360 |
35 | 39 | 37 | 10 | 370 | 13690 |
40 | 44 | 42 | 5 | 210 | 8820 |
45 | 49 | 47 | 3 | 141 | 6627 |
n =40 | ΣFX = 1365 | ΣFX² = 48475 |
No hay comentarios:
Publicar un comentario