La Distribución Normal
¿Que es la distribución normal?
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Karl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar. La función de densidad de la curva normal está definida por la siguiente ecuación:
La distribución continua de probabilidad más importante de toda la estadística es la distribución de probabilidad normal. Como vimos anteriormente, una variable aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos valores usualmente resultan de medir algo ( medidas de longitud, de peso, de tiempo, de temperatura etc.)
Características de la distribución de probabilidad normal
La distribución de probabilidad normal y su curva tiene las siguientes características:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución.
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
La distribución normal estándar
La forma de la campana de Gauss depende de los parámetros μ y σ . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de σ, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
Como se deduce, no existe una única distribución normal, sino una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su desviación estándar. En la siguiente gráfica puedes ver una distribución normal con μ=0 y σ=1 (en azul) y una distribución normal con μ=1 y σ=0.5 (en rojo):
Para facilitar los cálculos se decidió tabular la normal para diferentes probabilidades con variables que siguen la distribución normal. Pero, puesto que sería imposible tener una tabla para cada posible distribución normal, se elaboró solo una tabla, la tabla de la distribución normal estándar, que es la distribución con media igual a cero y desviación estándar igual a uno.
De esta manera solo se tiene que transformar o estandarizar una distribución normal específica, se revisa la tabla, y se conoce la probabilidad. Para estandarizar los valores de una variable, se utiliza la siguiente fórmula:
Gracias a esta fórmula podemos transformar cualquier distribución normal a la distribución normal estándar y determinar una probabilidad.
Cálculo de probabilidades con la curva normal
Una característica que tiene cualquier distribución normal es que el área bajo la curva, que representa la probabilidad de que la variable aleatoria tome ciertos valores, se distribuye siempre en la misma proporción.
En la tabla de la distribución normal estándar, están registradas las áreas bajo la curva normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se necesita transformar la distribución normal de interés en una distribución normal estándar mediante la fórmula, y el área a la derecha del valor Z será el mismo que el área a la derecha de x.
Ejemplo:
Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviación estándar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) Tenga un coeficiente mayor de 120.
b) Tenga un coeficiente mayor de 100.
Solución:
a) P(x > 120)
Hay una distribución normal con media 115 y desviación estándar de 12 y queremos saber cual es la probabilidad de que x sea mayor de 120, es decir, cuanto mide el área a la derecha del 120.
Lo primero es transformar esta distribución normal en una distribución normal estándar (con media cero y desviación estándar 1), para lo cual hay que cambiar el valor de x por un valor Z con la fórmula.
Z = | x - μ | = | 120 - 115 | = 0.41 |
σ | 12 |
La distribución ya transformada queda así:
Se busca el valor del área a la derecha del valor Z en la tabla de áreas bajo la curva normal, la unidad y la primer decimal se buscan en la primer columna, y la segunda decimal en el primer renglón, donde se cruzan renglón y columna es el valor del área a la derecha del valor z. En este ejemplo:
z | 1 |
0.4 | .34090 |
Y como el área a la derecha del valor z es el área que buscamos, entonces este es el resultado, es decir, la probabilidad de que un aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es .34090
b) P(x > 100)
Para encontrar la probabilidad de que un aspirante tenga un coeficiente intelectual mayor de 100, primero se traza la curva de la distribución normal original, para luego transformarse en la distribución normal estándar.
El valor z se calcula con la fórmula:
Z = | x - μ | = | 100 - 115 | = -1.25 |
σ | 12 |
En la tabla de áreas bajo la curva normal no se tabularon valores z negativos, pero como la curva normal es simétrica, el área a la izquierda del valor z = -1.25 es del mismo tamaño que el área a la derecha del valor z = 1.25, por lo que solo se necesita buscar en la tabla el área correspondiente al valor positivo.
z | 5 |
1.2 | .10565 |
El área de .10565 corresponde a la que se encuentra a la izquierda del valor z, pero nosotros no queremos esa área, sino la se encuentra a la derecha, que podemos calcular restando el área de .10565 al área total bajo la curva que es 1.
P( x > 100 ) = 1 - .10565 = 0.89435
No hay comentarios:
Publicar un comentario