PRUEBA DE HIPÓTESIS RELATIVAS A UNA MEDIA

En el presente artículo aplicaremos el procedimiento de cuatro pasos para probar una hipótesis propuesto en el artículo titulado PRUEBA DE HIPÓTESIS, tanto para problemas con muestras grandes, como con muestras pequeñas.

PRUEBA CON MUESTRA GRANDE

Para ilustrar el procedimiento, resolveremos el siguiente problema:

Se afirma que el tiempo que pasan los niños viendo la TV en México es por lo menos de 4 horas al día. Para probar esta afirmación se obtuvo la siguiente muestra de 45 niños seleccionados aleatoriamente de las principales ciudades de este país. Utilizar un nivel de confianza de 0.01

Horas al día que ven tv los niños
4 4 4 4 3 4
4 4 3 5 4 6
4 4 4 3 5 4
4 5 3 5 3 4
5 4 4 4 4 4
5 3 4 4 2 4
4 4 5 5 4 5
3 3 4      

PASO 1. ESTABLECER LAS HIPÓTESIS NULA Y ALTERNA

Este par de hipótesis deben de ser excluyentes, y los signos que pueden tomar estas hipótesis son los siguientes:

Ha:Ho:
<
>
=

En este ejemplo se afirma que los niños ven TV por lo menos 4 horas al día (μ ≥ 4), por el signo, esa es la hipótesis Nula, y por lo tanto la hipótesis alterna seria lo contrario (μ < 4).Las hipótesis quedan de la siguiente manera:

Hipótesis Nula:
Ho: "Los niños ven TV por lo menos 4 horas al día".
Ho: μ ≥ 4

Hipótesis alterna:
Ha: "Los niños ven TV menos de 4 horas al día".
Ha: μ < 4

PASO 2. DETERMINAR EL CRITERIO DE CONTRASTE

Determinar el criterio de contraste consiste en especificar el nivel de significancia, el tipo de distribución, y los valores críticos.

a) Nivel de significancia.

Nivel de significancia.
Es la probabilidad de rechazar una hipótesis nula verdadera, es decir la probabilidad de cometer error tipo I. El nivel de significancia es simbolizado por α.

En este ejemplo el nivel de confianza es:

α = 0.01

b) El tipo de distribución. Se determina dependiendo de la naturaleza de la hipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a medias poblacionales y las muestras son grandes (n > 30) se utiliza la distribución normal. Cuando la hipótesis es relativa a la media y la muestra es chica ( n ≤ 30) se utiliza la distribución t de student. Como tenemos una muestra de tamaño n=45 utilizaremos la distribución Normal.

c) Los valores críticos.

Valores Críticos.
Son los valores de la variable de la distribución que limitan el área crítica, que es la parte de la curva que corresponde al nivel de significancia.

El área crítica cuando la hipótesis alterna tiene el símbolo (≠) se divide entre dos y se dice que el problema es de dos colas, y cada cola vale α/2. Si la Ha tiene el signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la cola derecha, y en ambos casos la cola vale α. Tal como se muestra en la ilustración siguiente:

Por lo pronto, en este problema el signo de la hipótesis alterna es (<), por lo que se utilizará la cola izquierda cuya área vale;

α = 0.01

El valor crítico se obtuvo de la tabla de la Distribución Normal, localizando el valor más cercano al valor de α = 0.01. Una vez hecho esto identificamos renglón y columna, en este caso el valor más cercano es el 0.00990 que se encuentra en el renglón 2.3 y en la columna 3. Juntamos estas dos cantidades y obtenemos el 2.33, pero como el área crítica se encuentra a la izquierda del cero, el valor crítico es negativo:

z = -2.33

Paso 3. Calcular el estadístico de prueba

El estadístico de prueba es un valor que se obtendrá de la información de la muestra, y se comparará con el valor obtenido en el criterio de contraste, y así, rechazar o aceptar la hipótesis alterna. La notación del estadístico de prueba cambia de acuerdo a la distribución que se utilice, si utilizamos la curva normal la notación será Z*, y si utilizamos la tabla t se simboliza t*.

Lo primero que tenemos que calcular es la media y la desviación estándar:

En seguida, calculamos el error estándar de la media:

Por último, calculamos el "Estadístico de Prueba" con la siguiente fórmula, donde μ es la media hipotética de la población:

Paso 4. Conclusión

La regla de decisión es establecer las condiciones sobre las cuales se acepta o rechaza una hipótesis. Si al localizar estadístico de prueba z* queda dentro de la zona crítica la hipótesis alterna deberá ser aceptada. Si queda fuera de la zona crítica (cola), la hipótesis alterna deberá ser rechazada.

Localizamos z*=0.198 en la curva y queda fuera de la cola; por lo tanto se acepta la hipótesis nula. La conclusión la redactamos en estos términos u otros parecidos.

"Hay suficiente evidencia para afirmar que los niños de México ven TV por lo menos 4 horas al día".

PRUEBA CON MUESTRA PEQUEÑA

Básicamente el procedimiento es el mismo con muestra pequeña (n ≤ 30) que con muestra grande (n > 30), el cambio radica en el tipo de distribución, mientras que con las muestras grandes se utiliza "Z", con la muestras pequeñas se usa "t", analicemos el siguiente ejemplo:

Se afirma que la colegiatura que pagan los estudiantes de universidades particulares de la ciudad de Chihuahua es en promedio de 2500 pesos al mes. Para probarlo se obtuvo la siguiente muestra de 20 estudiantes de escuelas particulares de la ciudad de Chihuahua. Utilice un nivel de significancia de .05.

2800 3100 2300 2500 3200
2300 3100 2700 2600 2900
3800 3000 3100 2600 2000
3000 3200 2200 2000 2400

PASO 1. ESTABLECER LAS HIPÓTESIS NULA Y ALTERNA

Hipótesis Nula:
Ho: "La colegiatura promedio de los estudiantes no es diferente de 2500 pesos".
Ho: μ= 2500

Hipótesis alterna:
Ha: "La colegiatura promedio de los estudiantes es diferente de 2500 pesos".
Ha: μ≠ 2500

PASO 2. DETERMINAR EL CRITERIO DE CONTRASTE

a) Nivel de significancia.

α = 0.05

b) Tipo de distribución.

Cuando la hipótesis es relativa a la media y la muestra es chica ( n ≤ 30) se utiliza la distribución t de student. Como tenemos una muestra de tamaño n=20 utilizaremos la distribución t de student.

c) Los valores críticos

Cuando la hipótesis alterna tiene el símbolo (≠), el nivel de significancia se divide entre dos y se dice que el problema es de dos colas, y cada cola vale α/2.

α/2 = 0.05/2 = .025

Los valores críticos se obtuvieron de la tabla de la distribución t de student, el valor donde se cruzan, la columna que es el valor de la cola de la curva, en este caso α/2 y el renglón, dado por los grados de libertad, Φ=n-1.

Paso 3. Calcular el estadístico de prueba

El estadístico de prueba es un valor que se obtendrá de la información de la muestra, y se comparará con el valor obtenido en el criterio de contraste, y así, rechazar o aceptar la hipótesis alterna. La notación del estadístico de prueba cambia de acuerdo a la distribución que se utilice, si utilizamos la curva normal la notación será Z*, y si utilizamos la tabla t, como en este caso, se simboliza t*.

Lo primero que tenemos que calcular es la media y la desviación estándar:

En seguida, calculamos el error estándar de la media:

Por último, calculamos el "Estadístico de Prueba" con la siguiente fórmula:

Paso 4. conclusión

Una regla de decisión es establecer las condiciones sobre las cuales se acepta o rechaza una hipótesis. Si al localizar estadístico de prueba t* queda dentro de la zona crítica la hipótesis alterna deberá ser aceptada. Si queda fuera de la zona crítica (cola), la hipótesis alterna deberá ser rechazada.

Como podemos ver, al localizar la t*=2.31 en la curva supera el valor de t=2.09 y queda dentro de la cola; por lo tanto se acepta la hipótesis alterna. La conclusión la redactamos en estos términos u otros parecidos.

"Hay suficiente evidencia para afirmar que las colegiaturas que pagan los estudiantes universitarios de Chihuahua son en promedio diferentes de 2500 pesos".

VER: Prueba de hipótesis relativas a la media de dos poblaciones

EJERCICIOS

1.- Una compañía fabricante de llantas necesita comprobar que la vida útil de los neumáticos que fabrica no es menor de 50,000km. Para verificar la afirmación se prueba una muestra de 36. Se obtuvieron los siguientes resultados en miles de kilómetros:

Vida útil de los neumáticos
58 52 54 52 48 58
53 59 45 60 56 45
48 48 55 46 52 53
61 52 45 55 51 52
37 51 49 45 48 60
62 54 61 65 55 61

a) Pruebe que la vida útil promedio de los neumáticos no es menor de 50,000 km. en un nivel de significancia de .01.

b) Pruebe que la vida útil de los neumáticos es en promedio igual a 60,000 km. en un nivel de significancia de .05.



2.- El control de calidad de una compañía que produce harina, verifica que la presentación del producto en paquete de 1 kg contenga dicha cantidad. Se obtuvo una muestra de 50 paquetes los cuales dieron tuvieron los siguientes pesos en gramos:

Vida útil de los neumáticos
9941043101110531015
10451003946985997
10179879869661006
9799749711023936
99410141000934970
997989998922987
9519601027971999
95899910069521014
99710191034977965
100099510009721015
a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de los paquetes es diferente a un kilo si el nivel de significancia es .01?

b) Se obtuvo otra muestra, esta de 25 paquetes, con una media de .971 Kg. y una desviación de .35 Kg. Con un nivel de significancia de .02, ¿Podemos afirmar la hipótesis de que los paquetes contienen menos de 1 kg.?

No hay comentarios: