PRUEBA DE HIPÓTESIS

¿QUÉ ES?

Hipótesis es una afirmación o suposición respecto al valor de un parámetro poblacional que necesita ser probada.

Son ejemplos de hipótesis, o afirmaciones hechas sobre un parámetro poblacional las siguientes:

• El ingreso mensual promedio de todos los ciudadanos es $7500.00

• El 20% de los delincuentes capturados son sentenciados a prisión

• El 90% de las formas fiscales son llenadas correctamente

Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes que no es factible estudiar todos sus elementos, por lo que es necesario tomar una muestra de la población y determinar si la evidencia soporta o no la afirmación.

Una prueba de hipótesis es un procedimiento basado en una evidencia muestral y la teoría de la probabilidad, usado para determinar si la hipótesis es una afirmación razonable para no ser rechazada, o es una afirmación poco razonable y ser rechazada.

PROCEDIMIENTO PARA PROBAR UNA HIPÓTESIS

Este procedimiento sistematiza la prueba de hipótesis, y a través del cual podremos tomar la decisión de rechazar o no rechazar una hipótesis. Sin embargo, el procedimiento estadístico de prueba de hipótesis no proporciona pruebas de que algo es verdadero, tal como un razonamiento matemático lo haría. Con esta técnica estadística obtenemos una prueba "mas allá de la duda razonable", tal como lo haría un abogado en un juicio.

PASO 1. ESTABLECER LAS HIPÓTESIS NULA Y ALTERNA

El primer paso es establecer la hipótesis a ser probada. Esta es llamada hipótesis nula y se representa con H0. El subíndice cero implica "ninguna diferencia". Encontramos usualmente el término "no" en la hipótesis nula, indicando que "no hay diferencia". Por ejemplo, respondiendo a la pregunta ¿los mexicanos ganan en promedio 7500 pesos al mes? La hipótesis nula podría ser: "El sueldo promedio de los mexicanos no es significativamente diferente de 7500 pesos" que es similar a decir que el sueldo promedio (μ) es igual a 7500 pesos. Entonces, la hipótesis nula debería ser representada H0: μ=7500. Es decir, la hipótesis nula es una afirmación que deberá ser aceptada si nuestra muestra de datos no logra proporcionarnos evidencia para convencernos de que es falsa.

Debemos enfatizar en que si aceptamos la hipótesis nula basados en la muestra de datos, estamos diciendo que la evidencia no nos permite rechazarla. En otras palabras aceptamos la H0, pero no probamos que la H0 sea verdad. Para comprobar que la hipótesis nula es verdadera "sin lugar a dudas" es necesario que nuestra investigación llegue a todos los elementos de la población, lo cual no es muy factible. Por eso la alternativa es tomar una muestra.

La Hipótesis Nula es una afirmación tentativa sobre un parámetro poblacional. Usualmente supone que el parámetro poblacional tiene un valor específico.

La hipótesis alterna describe lo que crees que sucederá cuando has rechazado la hipótesis nula. También es llamada hipótesis de investigación, y se representa con Ha. La hipótesis alterna será aceptada si la muestra de datos nos proporciona evidencia de que la hipótesis nula es falsa.

La Hipótesis Alterna es una afirmación que será aceptada si nuestra muestra de datos nos proporciona suficiente evidencia de que la hipótesis nula es falsa.

Este par de hipótesis deben de ser excluyentes, si se acepta una entonces se rechaza la otra; si Ha dice "menor", la H0 dirá "no es menor"; o si Ha dice "mayor" la H0 dice "no es mayor". Por lo cual, los signos que podrían adoptar estas hipótesis son los siguientes:

Ha:<>
Ho:=

PASO 2. DETERMINAR EL CRITERIO DE CONTRASTE

Determinar el criterio de contraste consiste en especificar el nivel de significancia, el tipo de distribución, y los valores críticos:

a) Nivel de significancia. Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis:

Nivel de significancia es el riesgo que asumimos de rechazar la hipótesis nula cuando realmente es verdadera.

El nivel de significancia se representa con la letra griega alfa (α). También es conocida como nivel de riesgo, término que podría ser muy apropiado ya que es el riesgo que se toma de rechazar una hipótesis nula verdadera.

En este procedimiento se trata de controlar la probabilidad de cometer error tipo I, por eso se establece desde el inicio. En Estadística siempre hay la probabilidad de que suceda dicho error, únicamente conociendo la población completa se podría eliminar.

No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es aplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 a sondeos políticos. Tú como investigador debes decidir el nivel de significancia antes de colectar la muestra de datos.

b) Tipo de distribución. Existen varias distribuciones de probabilidad, como la z, la t, la F y la χ2, cada una apropiada a diferentes situaciones, que se revisarán en otras secciones. Por ejemplo, cuando queremos probar hipótesis relativas a medias con muestras grandes, se utiliza la Z (Distribución Normal); y cuando queremos probar hipótesis relativas a medias con muestras pequeñas se utiliza la t (Distribución t de Student).

En prueba de hipótesis relativas a medias
Si n > 30 se utiliza Z
Si n ≤ 30 se utiliza t

c) Valores críticos. Se le llama "valor crítico" al valor que toma la variable aleatoria (z o t) en el punto donde comienza la zona de aceptación de Ha en la curva de la distribución.

¿Cuantas y cuales colas vamos a utilizar?, depende del signo de la Ha el que utilicemos alguna o ambas colas, así como se muestra en la siguiente ilustración. Donde se puede ver que la zona de aceptación de Ha se encuentra en la "cola" de la curva y su área corresponde al valor del nivel de significancia (α) cuando es una cola, y α/2 cuando son dos colas.

El valor crítico se obtiene buscando el valor de la cola en la "Tabla Normal" cuando la muestra es grande, o en su defecto en la "Tabla t de student" cuando la muestra es pequeña, siempre que se trate de hipótesis relativas a medias.

PASO 3. CALCULAR EL ESTADÍSTICO DE PRUEBA

El estadístico de prueba es un valor que se obtendrá de la información de la muestra, y se comparará con el valor obtenido en el criterio de contraste, y así, rechazar o aceptar la hipótesis nula. La notación del estadístico de prueba cambia de acuerdo a la distribución que se utilice, si utilizamos la curva normal la notación será Z*, y si utilizamos la tabla t, como en este caso, se simboliza t*.

Estadístico de prueba es un valor obtenido de la información muestral, que al ser comparado con los valores críticos obtenidos en el criterio de contraste podemos aceptar o rechazar la hipótesis nula.

Cuando se trata de probar hipótesis relativas a medias, el procedimiento para calcular el estadístico de prueba es:

1) Calcular los estadísticos de la muestra.

2) Calcular el error estándar.

3) Calcular el estadístico de prueba.

Las fórmulas varían dependiendo del tipo de prueba de hipótesis.

PASO 4: CONCLUSIÓN.

La regla de decisión establece las condiciones sobre las cuales se acepta o rechaza una hipótesis. Si al localizar estadístico de prueba en la curva queda dentro de la zona crítica la hipótesis nula deberá ser rechazada. Si queda fuera de la zona crítica (cola), la hipótesis nula es la que deberá ser aceptada.

A continuación se muestran dos enlaces en donde se aplica este procedimiento para probar hipótesis relativas a una media o a dos medias.

1 comentario:

Itzel dijo...

Gracias por tomarse el tiempo de explicarlo, fue de gran ayuda :)