PRUEBA DE HIPÓTESIS
DEFINICIÓN DE HIPÓTESIS
Hipótesis es una aseveración o suposición respecto al valor de un parámetro poblacional. Con el propósito de ponerse a prueba y para verificar si es verdadera o falsa, se usan datos extraídos de la población, ya que en algunos casos la población es tan grande que por diversas razones no es factible estudiar todos los elementos, objetos o personas en la población.
Ejemplos de hipótesis acerca de un parámetro de población: La media mensual de ingresos para profesionistas de cualquier área es de $13,625.00 El 20% de los estudiantes de nivel medio superior tienen empleo. La probabilidad de que aprueben la materia de estadística a nivel maestría es de 0.70
PRUEBA DE HIPÓTESIS La prueba de hipótesis es un procedimiento basado en una evidencia muestral y la teoría de la probabilidad, usada para determinar si la hipótesis es una afirmación razonable para no ser rechazada, o si es una afirmación poco razonable y ser rechazada. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre el estadístico de muestra y un valor planteado del parámetro.
PASOS PARA REALIZAR UNA PRUEBA DE HIPÓTESIS
PASO 1.- SE PLANTEAN LAS HIPÓTESIS NULA Y ALTERNATIVA La hipótesis a ser probada es la HIPÓTESIS NULA, simbolizada por Ho, el subíndice cero implica “cero diferencia”. Usualmente el término “no”, es encontrado en la hipótesis nula significando “no cambio”. Ejemplo de hipótesis nula: “la colegiatura mensual promedio de los estudiantes universitarios no es diferente de 3000 pesos”. Esto es lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puede simbolizar Ho: µ = 3000. La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no nos proveen de evidencia convincente de que es falsa, es decir, si se acepta la hipótesis nula decimos que la evidencia no es suficiente para rechazarla pero no podemos afirmar que es verdadera.
La HIPÓTESIS ALTERNA es la afirmación que se acepta, si se rechaza la hipótesis nula. Esta hipótesis, también llamada hipótesis de investigación, se simboliza con H1 (a veces con Ha). La hipótesis alterna es aceptada si la evidencia proporcionada por la muestra es suficiente para afirmar que la Ho es falsa. En este ejemplo las hipótesis serían las siguientes: Ho: La colegiatura promedio de los estudiantes no es diferente de 3000 pesos Ho: µ = 3000 H1: La colegiatura promedio de los estudiantes es diferente de 3000 pesos H1: µ ≠ 3000
PASO 2: SELECCIONAR EL NIVEL DE SIGNIFICANCIA. NIVEL DE SIGNIFICANCIA: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población. No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es aplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 a sondeos políticos.
PRUEBA DE SIGNIFICANCIA DE UNA COLA
Una prueba es de una cola cuando la hip贸tesis alterna, H1, establece una direcci贸n. Ho : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Distribuci贸n de muestreo para el valor estad铆stico z, prueba de una cola, nivel de significancia de .05
PRUEBA DE SIGNIFICANCIA DE DOS COLAS Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis alterna H1. Ho : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Distribución de muestreo para el valor estadístico z, prueba de dos colas, nivel de significancia de 0.05
El área crítica cuando la hipótesis alterna tiene el símbolo (≠ ) se divide entre dos y se dice que el problema es de dos colas, y cada cola vale α/2. Si la H1 tiene el signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la cola derecha, y en ambos casos la cola vale α. Significancia de una cola: Ho: IµM ≤ IµH H1: IµM > IµH
Significancia de dos cola: Ho: IµM = IµH H1: IµM ≠ IµH
TIPOS DE ERRORES Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o de la H1, puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisi贸n equivocada. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles.
Hip贸tesis Nula (Ho)
Aceptar Ho
Rechazar Ho
Ho verdadera
Decisi贸n correcta
Error Tipo I
Ho falsa
Error Tipo II
Decisi贸n correcta
PASO 3: CÁLCULO DEL VALOR ESTADÍSTICO DE PRUEBA El estadístico de prueba es un valor que se obtiene a partir de la información muestral, para compararlo con el criterio de contraste y rechazar o aceptar la hipótesis, existen muchos estadísticos de prueba como son los estadísticos Z y t.
La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras de la prueba son iguales o mayores a 30 se utiliza el estadístico Z, en caso contrario se utiliza el estadístico t.
PRUEBA PARA LA MEDIA POBLACIONAL CON DESVIACIÓN ESTÁNDAR POBLACIONAL CONOCIDA Cuando se hace una prueba para la media poblacional de una muestra y se conoce la desviación estándar, el estadístico de prueba está dado por:
Muestra grande n ≥ 30 datos
Muestra pequeña n < 30 datos
VALOR P EN LA PRUEBA DE HIPÓTESIS Valor p: es la probabilidad de observar un valor muestral tan extremo o más que el valor observado, dado que la hipótesis nula es verdadera. Si el valor p es menor que el nivel de significancia, Ho se rechaza. Si el valor p es mayor que el nivel de significancia, Ho no se rechaza. Cálculo del valor p Prueba de una cola: valor p = P { z el valor absoluto del estadístico de prueba calculado} Prueba de dos colas: valor p = 2P { z el valor absoluto del estadístico de prueba calculado}
PRUEBA PARA LA MEDIA POBLACIONAL CON DESVIACIÓN ESTÁNDAR POBLACIONAL DESCONOCIDA Aquí σ es desconocida, así que se estimará con la desviación estándar de la muestra s.
Muestra grande n ≥ 30 datos
Muestra pequeña n < 30 datos
PRUEBA DE HIPÓTESIS: DOS MEDIAS POBLACIONALES Suponga que los parámetros para dos poblaciones son:
Para muestras grandes el estadístico de prueba es con la tipificación “z”. Cuando σ1 y σ2 no se conocen pero el tamaño de muestra n1 y n2 es mayor o igual que 30, el estadístico de prueba es :
PRUEBA PARA ENSAYOS CON UNA SOLA RELACIÓN PROPORCIONAL DE POBLACIÓN
Número de éxitos en la muestra p= Número muestreado
PRUEBA DONDE INTERVIENE LA DIFERENCIA ENTRE DOS RELACIONES PROPORCIONALES DE POBLACIÓN.
El estadístico de prueba en este caso es:
PASO 4: FORMULAR UNA REGLA DE DECISIÓN.
Se establecen las condiciones específicas en la que se rechaza Ho y las condiciones en que no se rechaza Ho. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota.
Distribución muestral del valor estadístico z, con prueba de una cola a la derecha.
Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula.
PASO 5: TOMAR UNA MUESTRA Y TOMAR UNA DECISIÓN. En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Se debe tener presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II). Si se rechaza Ho, entonces se esta aceptando H1.
Problema 1
(DESVIACIÓN ESTÁNDAR POBLACIONAL DESCONOCIDA)
El jefe de Control Escolar de la UNID, manifiesta que el número promedio de usuarios de la biblioteca por día es de 350. Para confirmar o no este supuesto se controla la cantidad de usuarios que utilizaron la biblioteca durante 30 días. Se considera el nivel de significancia de 0.05. Se obtuvieron los siguientes datos: Día
Usuarios
Día
Usuarios
Día
Usuario
1
356
11
305 21
429
2
427
12
413 22
376
3
387
13
391 23
328
4
510
14
380 24
411
5
288
15
382 25
397
6
290
16
389 26
365
7
320
17
405 27
405
8
350
18
293 28
369
9
403
19
276 29
429
10
329
20
417 30
364
Problema 2
(DOS RELACIONES PROPORCIONALES DE POBLACIÓN)
¿Es más probable que los estudiantes solteros falten más que los estudiantes casados? Una muestra de 250 estudiantes casados indicó que 22 faltaron más de 5 días el año pasado, mientras que una muestra de 300 estudiantes solteros indicó que 35 faltaron más de 5 días. Utilice .05 de nivel de significancia.
Problema 3 (DOS MEDIAS POBLACIONALES) Se conocen los datos de dos muestras de dos poblaciones, que son los siguientes: X1 = 74
X2 = 78
S12 = 225
S22 = 169
n1 = 42
n2 = 56
Se pide contrastar estad铆sticamente si existe diferencia entre las dos poblaciones, a un nivel de significaci贸n del 0.05. Las dos poblaciones siguen una distribuci贸n Normal.
Problema 4 (DESVIACIÓN ESTÁNDAR POBLACIONAL DESCONOCIDA)
Una prueba de destreza, se afirma, que se resuelve en 16 minutos de manera ideal. Se elije una muestra de 36 alumnos a los cuales se les aplica la prueba y da un tiempo medio de 16.12 minutos con una desviación estándar de 0.5 minutos. ¿Esta el proceso fuera de control para un nivel de significancia de 0.05?
Problema 5 (DOS MEDIAS POBLACIONALES)
Se realizo un estudio en dos escuelas de nivel medio superior; una particular y otra pública para comparar las horas promedio semanales, que dedicaban a estudiar extraclase los alumnos. Con un nivel de significancia de 0.01 ¿Se puede concluir que los alumnos de la escuela particular dedican más tiempo a estudiar de manera extraclase que los de la escuela pública, según la muestra?
Parámetro
Media de la muestra (horas) Desviación estándar de la muestra (horas) Tamaño de la muestra (alumnos)
Escuela particular
Escuela Pública
(población 1)
(población 2)
25.6
30.4
2.9
3.6
40
45