Inferencia estadistica. Test de hipotesis by Miguel Perez

Statistics Inferencial Statistics III. Test de hip贸tesis

OpenUepc.com 1.1.5.5.3

Ver 01:05/02/2010

NOTA La clasificación decimal de todos los temas de este manual tienen implícito el comienzo 1.1.5.5.3 correspondiente a 1

SCIENCE

1.1

MATHEMATICS

1.1.5

STATISTICS

1.1.5.5

INFERENCIAL STATISTICS

1.1.5.5.3

TEST DE HIPOTESIS

COPYLEFT Este material así como los applets, powerpoints, videos y archivos de sonido asociados, puede ser distribuido bajo los términos y condiciones definidos en Open Publication License versión 1.0 o posterior (La versión más reciente está disponible en http://www.opencontent.org/openpub/). El contenido está sujeto a constantes cambios sin previo aviso. Su fin es didáctico y solo pretende la universalización de la cultura. Está escrito en base a la colaboración de las miles de personas que componen nuestra comunidad OpenUepc. Se ha exigido a los autores que referencien todas las fuentes utilizadas y figuran al final del texto. Cualquier distribución del mismo debe mencionar a OpenUepc como fuente. Miguel Pérez Fontenla miguelperez@edu.xunta.es INDICE AUTORES

Iniciado por: Miguel Pérez Fontenla 12/12/2009

TABLA DE CONTENIDO Introducción .............................................................................................................................. 2 History ................................................................................................................................... 2 Aplicaciones de los contrastes de hipótesis ........................................................................... 2 CONCEPTOS BÁSICOS.......................................................................................................... 3 Hipótesis estadística .............................................................................................................. 3 Test de hipótesis .................................................................................................................... 3 Etapas de un test de hipótesis. Región crítica........................................................................ 3 Test de hipótesis bilaterales y unilaterales ............................................................................ 4 Tipos de error......................................................................................................................... 9 Función de potencia ............................................................................................................. 10 CONTRASTES DE HIPÓTESIS MÁS COMUNES ............................................................. 11 Contraste de hipótesis para la proporción ........................................................................... 11 Contraste de hipótesis para la varianza de una población normal ....................................... 13 Pruebas de ajuste .............................................................................................................. 13 Prueba χ2 de Pearson ........................................................................................................ 13 Prueba de ajuste de Kolmogorov-Smirnov (K-S) ............................................................ 16 Contraste de hipótesis para la diferencia de medias ............................................................ 17

WikiMaths | Introducción 1

Introducción

History Hypothesis testing is largely the product of Ronald Fisher, Jerzy Neyman, Karl Pearson and (son) Egon Pearson. Fisher was an agricultural statistician who emphasized rigorous experimental design and methods to extract a result from few samples assuming Gaussian distributions. Neyman (who teamed with the younger Pearson) emphasized mathematical rigor and methods to obtain more results from many samples and a wider range of distributions. Modern hypothesis testing is an (extended) hybrid of the Fisher vs Neyman/Pearson formulation, methods and terminology developed in the early 20th century. http://en.wikipedia.org/wiki/Statistical_hypothesis_testing

Aplicaciones de los contrastes de hipótesis Los contrastes de hipótesis, como la inferencia estadística en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las teorías científicas basándose en los conceptos de la inferencia estadística en general y de los contrastes de hipótesis. En este contexto, cuando se desea optar entre dos posibles teorías científicas para un mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a partir de los datos disponibles sobre el fenómeno que permitan optar por una u otra. Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, etcétera .http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesis

WikiMaths | Introducción 2

CONCEPTOS BÁSICOS Los contrastes de hipótesis los vamos a usar para tomar decisiones acerca de las características de la población.

Hipótesis estadística Una hipótesis estadística es cualquier afirmación que se haga referida a cualquier característica desconocida de la población, ya sea el valor que pueda tomar un determinado parámetro o el tipod e distribución que sigue la población. Puede solo tomar dos valores: Verdadera o Falsa

Test de hipótesis Un test o contraste de hipótesis es un proceso de decisión que nos permite determinar si una hipótesis estadística debe ser aceptada o rechazada. Los contrastes de hipótesis pueden ser simples si al aceptarla queda perfectamente especificada la distribución poblacional o compuesta si al aceptarla queda todavía desconocido algún parámetro poblacional. También podemos clasificar los contrastes de hipótesis en dos clases el contraste de hipótesis paramétrico cuando está referida a un parámetro de la población, y contraste de hipótesis ............. sobre el tipo de distribución que sigue una población. El procedimiento que seguiremos es • Formular una hipótesis; • se toma una muestra; • buscamos el estimador adecuado; • establecemos un nivel de significación; • buscamos un intervalo de aceptación y en base a los resultados • aceptamos o rechazamos la hipótesis. El contraste no establece la veracidad o falsedad a ciencia cierta de la hipótesis sino que nos da un criterio para aceptarla o no como verdadera.

Etapas de un test de hipótesis. Región crítica Vamos a pormenorizar más estos apartados del siguiente modo: 1. Hacemos una prueba y partimos de una Hipótesis H0, que denominamos hipótesis nula, que suponemos Verdadera. Su complementaria es denominada hipótesis alternativa H1. 2. Definimos la ley de probabilidad que sigue la población y la distribución muestral. 3. Establecemos un nivel de significación α que es la probabilidad con la cual sometemos la hipótesis H0 a prueba. 4. Determinamos las zonas o regiones de aceptación (A) de H0, y regiones de rechazo (C) de H0, también llamada región crítica. Para ello definimos valor crítico, aquel a partir del cual rechazamos la hipótesis H0. 5. Seleccionamos una muestra aleatoria y calculamos el estadístico que hayamos elegido para estimar el parámetro buscado. 6. Establecemos la regla de decisión, de aceptar o no la hipótesis nula H0. En caso de no aceptación de H0, se supone que aceptamos la hipótesis alternativa H1. WikiMaths | CONCEPTOS BÁSICOS 3

Test de hipótesis bilaterales y unilaterales Cuando la región crítica está situada a ambos lados de la zona de aceptación de H0, el contraste se denomina bilateral o de dos colas. Por ejemplo, si se trata de estas dos hipótesis, sería bilateral H0 : µ = 200 H1 : µ ≠ 200 Y la región crítica correspondería a un gráfico como el siguiente:

Y si la región crítica se sitúa en una de las dos colas, se denomina contraste unilateral (derecho o izquierdo según el lado). Por ejemplo: H0 : µ1 ≤ µ2 H1 : µ1 > µ2 Y el gráfico sería

WikiMaths | CONCEPTOS BÁSICOS 4

Ejemplo

Se sabe que llamando X a la v.a. que mide la tensión arterial en toda España, ésta sigue una normal N(µ = 80, σE = 12). Se sospecha que el parámetro de la media µG podría ser distinto en Galicia, es decir que en Galicia se siguiese una N(µG, σG = 12). En lenguaje de hipótesis sería H0 : µG = 80 H1 : µG ≠ 80 (µG < 80 ó µG > 80) (contraste bilateral) Para comprobarlo se toma una muestra de n = 100 gallegos . Sabemos que la media 12   muestral sigue una X 100 N  80,  = N (80,1.2) 100   Bien, ahora suponemos que la hipótesis nula H0 es cierta, ello implica que la media muestral X 100 estará muy cercana a µ = 80, pero no podemos ser ambiguos en matemáticas, luego ... ¿a que llamamos muy cercana? Tenemos que precisar este dato y esto se hace a través del llamado nivel de confianza (1-α), o también a través del error medio que queremos cometer que será α. Supongamos que este nivel de confianza es del 95% = 0.95 ( o que el error o también llamado nivel de significación es del 0.05)

Entonces, a pesar de que nuestras suposiciones sean de que la tensión arterial en Galicia pueda ser distinta, la evidencia estadística nos da muchas opciones a que la conclusión sea la contraria, pues el área de rechazo es muy pequeña comparada con el área de aceptación de la hipótesis. La variable normal tipificada Z0.975 vale 1.96 (hay que buscarlo en las tablas de la N(0,1) o bien con Excel mediante =DIST.NORMAL.INV(0.975,0,1)=1.95996 )

WikiMaths | CONCEPTOS BÁSICOS 5

Regla de decisión: Ahora llega el momento de decidir, y lo hacemos de la siguiente manera X − 80 ∈ ( −1.96,1.96 ) entonces => acepto la hipótesis nula H0 Si 1.2 X − 80 ∈ ( ∞, −1.96 ) U (1.96, ∞ ) entonces => rechazo la hipótesis nula H0 y Si 1.2 aceptaríamos consecuentemente la hipótesis alternativa H1 lo que en lenguaje “coloquial” sería como decir que la tensión arterial de los gallegos sería significativamente distinta de la del resto de los españoles, y como es bilateral, podríamos aclarar si µG > 80 o µG < 80 Supongamos ahora, que calculamos la media muestral y nos da X = 85 como X − 80 85 − 80 = = 4.1667 ∉ ( −1.96,1.96 ) en este caso rechazaríamos la hipótesis nula 1.2 1.2 H0 y concluiríamos con que los gallegos tendrían presión arterial significativamente mayor que la de la media española. Si redujésemos el error α al 0.01 el intervalo variaría pues Z0.995 = 2.58 y la regla de decisión sería ahora

X − 80 ∈ ( −2.58, 2.58 ) entonces => acepto la hipótesis nula H0 1.2 X − 80 ∈ ( ∞, −2.58 ) U ( 2.58, ∞ ) entonces => rechazo la hipótesis nula H0 Si 1.2 Si

WikiMaths | CONCEPTOS BÁSICOS 6

X = 85 como Y en este caso con la media muestral X − 80 85 − 80 = = 4.1667 ∉ ( −2.58, 2.58 ) seguiríamos rechazando la hipótesis nula 1.2 1.2 H0 Ejemplo Se desea contrastar si es o no igual de probable que un bebé sea niño o niña. Parece ser que no, que si utilizamos rigurosamente la teoría de la probabilidad con los datos estadísticos disponibles existe una cierta probabilidad a favor de que un bebé sea niño que niña (será que la propia y sabia Naturaleza está realizando ajustes para compensar la mayor longevidad de las mujeres). Si, a modo de ejercicio, quisiésemos darle a este hecho forma de problema de contraste de hipótesis, podríamos tomar un dato estadístico cierto como el de tomar una muestra de 2130 niños recién nacidos de entre los nacimientos en Galicia en 1993 de los que resultaron 1107 varones y 1023 hembras. Consideramos la v.a. dicotónica X definida como X Ω  →

0 Si el bebe es niña → X ( A) =  A  1 Si el bebe es niño proporcion de niñas  P [ X = 0] = p donde   P [ X = 1] = 1 − p = q proporcion de niños Sean las hipótesis H0 : p = 0.5 (igual números de nacimiento de niñas que de niños) H1 : p < 0.5 (es menos probable que nazcan niñas) Si H0 es cierta, esperaríamos que de 2130 nacimientos hayan 1065 hembras y otros tantos varones, pero en la muestra realizada el dato es 1107 varones y 1023 hembras. Lo que hay que comprobar es si esta diferencia es significativamente alta o entra dentro de unos límites razonables de azar. Para poder realizar este contraste tenemos que establecer un hallar un valor c, llamado valor crítico, de manera que si el número de hembras de la muestra resulta mayor o igual que c aceptamos la hipótesis H0, o bien la damos por Verdadera; y si el número de hembras es menor que c rechazamos H0, o la damos por Falsa, aceptando H1. Este valor crítico c lo calculamos definiendo previamente el denominado nivel de significación α, que es la probabilidad de obtener en la muestra menos hembras que varones

Ejemplo En este ejemplo, supongamos que establecemos como α = 0.05. Como nuestra v.a. X es una binomial B(2130,0.5) la podemos aproximar por una normal

(

)

N ( np , npq ) = N 1065, σ = 2130 ⋅ 0.5 ⋅ 0.5 = N (1065, 23.08) de donde, como hemos establecido el nivel de significación α = 0.05

WikiMaths | CONCEPTOS BÁSICOS 7

c − 1065   P [ X < c] = P  Z < = 0.05 23.08   Buscamos en las tablas de la normal a quién corresponde este valor y resulta que es c − 1065 = −1.65 ⇔ c = 1065 − 23.08 ⋅1.65 = 1026.93 23.08 Como en nuestra muestra el número de hembras es 1023 menor que el valor crítico c = 1027, rechazamos la hipótesis H0 : p = 0.5

para -1.65, es decir

Ejemplo De la población de alumnos de un IES se extrae una muestra de 12 alumnos y se les mide la estatura, resultado las mediciones siguientes: 170 168 174 165 169 174 183 176 168 175 172 170

De la población completa de estudiantes sabemos que tiene media µ = 171.25 y desviación típica σ = 8.3. ¿Podemos afirmar que esta muestra procede realmente de este Instituto?

Solución 1) Llamamos hipótesis nula H0 a la afirmación de esta hipótesis, es decir afirmar que efectivamente, esta muestra pertenece a este IES, por lo que la hipótesis contraria H1 será no pertenecer al IES. Escrito en forma matemática diríamos H0 : µ0 = µ = 171.25 H1 : µ0 ≠ µ = 171.25 2) Las estaturas son clásicas distribuciones normales. En el caso de la población es una 8.3   N(171.25,8.3) y en el caso de la muestra una N 171.25,  12   3) El nivel de confianza lo establecemos nosotros mismos en un 95%. 4) Ahora elegimos un estadístico. Sabemos que el mejor estimador de la media poblacional µ es la media muestral X , que sabemos que sigue una distribución 8.3   N 171.25,  12  

σ σ   , µ0 + Z 0.975 ⋅ Sabemos también que el IC para la media es  µ0 − Z 0.975 ⋅ lo  n n 95%  σ σ   ≤ X ≤ µ0 + Z 0.975 ⋅ que equivale a decir que P  µ0 − Z 0.975 ⋅  = 0.95 , que en n n  nuestro caso es el intervalo

WikiMaths | CONCEPTOS BÁSICOS 8

8.3 8.3   ,171.25 + 1.96 ⋅ 171.25 − 1.96 ⋅  = (166.55,175.94 ) , que constituye la zona de 12 12   aceptación. 5) La muestra que hemos seleccionado de 12 alumnos tiene una media X = 172 6) Cuando X pertenece al intervalo de confianza entonces está dentro de la región de aceptación, por lo tanto aceptamos la hipótesis nula H0, en caso contrario se rechaza. Como aquí X = 172 ∈ (166.55,175.94 ) podemos aceptar la hipótesis nula H0.

Nuestra región de aceptación es el intervalo (166.55,175.94) y la región crítica o zona de rechazo son las dos zonas laterales a este intervalo, es decir {x/ x<167.37 ó x>176.65} En el ejemplo previo, podría haber ocurrido que hubiésemos tomado como muestra a 12 jugadores del equipo de baloncesto de este mismo instituto, de estaturas 180 178 184 175 179 184 195 188 180 187 184 182

cuya media muestral es 183, y como 183 no pertenece al intervalo (166.55,175.94) rechazaríamos la hipótesis nula H0, cuando realmente sí son estudiantes del instituto. Es decir, estaríamos rechazando una hipótesis verdadera.

Tipos de error El error consistente en rechazar una hipótesis que es verdadera se denomina de tipo I. En lenguaje probabilístico esto ocurre con una probabilidad P[Test H0 Falsa/ H0 es Verdadera]=P[Rechazar H0 / H0 es Verdadera] = P[Aceptar H1 / H0] = α, siendo α el nivel de significación o el error máximo permitido del contraste Si la situación fuese la contraria, es decir, si aceptamos como verdadera una hipótesis falsa, el error cometido se llama de tipo II, que equivale a P[Test H0 Verdadera / H0 es Falsa]=P[Aceptar H0 / H1 es Verdadera] = P[Aceptar H0 / H1] = β, donde β es el llamado nivel de significación del error II WikiMaths | CONCEPTOS BÁSICOS 9

El contraste de hipótesis sigue la estrategia de que la aceptación o rechazo de hipótesis esté basado en un error de tipo I muy pequeño de tal manera que sea muy improbable rechazar una hipótesis cuando es cierta

Ejemplo Un ejemplo clásico que hay que mencionar aquí para distinguir la importancia de los errores tipo I o tipo II es el error tipo judicial que describimos a continuación. Tenemos un juicio sobre un ciudadano A con las siguientes hipótesis iniciales: H0 : A es inocente o bien A es no culpable; H1 : A es culpable o bien, A no es inocente Cuando no existen pruebas suficientes de culpabilidad se suele aceptar H0, pero siempre se pueden cometer errores tales como Condenar a A cuando es inocente, es decir rechazar H0 siendo cierta. Error tipo I Absolver a A cuando es culpable, es decir aceptar H0 siendo falsa. Error tipo II. El primer error, desde el punto de vista moral, es terriblemente grave, por lo que toda la estrategia judicial debe orientarse a minimizar esta posibilidad, lo que en términos estadísticos sería establecer un nivel de significación suficientemente alto para que la probabilidad de equivocarnos sea lo más pequeña posible.

Función de potencia Si denominamos β al nivel de significación del error tipo II, resulta muy importante saber cuál es la probabilidad (1 – β) de aceptar la hipótesis alternativa H1 cuando ésta es cierta. Dado un nivel de significación α decimos que un contraste de hipótesis es más potente cuanto más probable sea aceptar la hipótesis alternativa H1 en el caso de que sea cierta. La hipótesis alternativa no tiene por qué tomar un único valor H1 , de hecho en general es compuesta del tipo H1 (θ < θ0) ó H1 (θ ≠ θ0). Es decir, que β es una función de θ, β(θ) que puede tomar una colección de valores. Resulta muy útil considerar la siguiente tabla:

H0 Verdadera

H0 Falsa = H1 Verdadera

Decisión Test H0

Decisión Test H1

Aceptar H0

Rechazar H0

Acierto Tipo I

Error Tipo I

(1 - α)

Nivel significación α

Error Tipo II

Acierto Tipo II

Potencia (1 – β)

Ejemplo Tenemos una población normal en la que se está estudiando el peso de sus miembros y conocemos la desviación σ = 4 Kg. Queremos trabajar con un nivel de significancia 0.05 y tenemos las hipótesis: WikiMaths | CONCEPTOS BÁSICOS 10

H0 : (µ = 75) H1 : (µ = 80) Si tenemos una muestra de 40 individuos de la que hemos obtenido una X = 78 Kg se pide contrastar las hipótesis dadas.

Solución Pdte

CONTRASTES DE HIPÓTESIS MÁS COMUNES Contraste de hipótesis para la proporción Se tiene una población de la que queremos contrastar una hipótesis sobre una determinada proporción de la misma, por ejemplo el número de habitantes con ojos azules, o farmacéuticos, o más altos de 1.90, etc. Tomamos una muestra de tamaño n y observamos que f de esos n elementos verifican la f característica prefijada, es decir, con una proporción p0 = . n

f y que, para n  p (1 − p )   muestras grandes ( n > 30 ) este estimador se distribuye según una N  p,  n   Hemos estudiado que un buen estimador de la proporción es precisamente p =

Las dos hipótesis nuestras son: H0 : (p = p0) La proporción de la muestra es acorde con la proporción poblacional p H1 : (p ≠ p0) La muestra no pertenece a la población estudiada Para un nivel de significación α, el intervalo de confianza  p (1 − p ) p (1 − p )   p−Z α  constituirá la región de aceptación de la hipótesis , p+Z α 1− 1−   n n 2 2   nula H0, con probabilidad 1 – α.

Ejemplo Se lanza una moneda 50 veces al aire y resultan 31 caras ¿Está la moneda trucada? En este caso la proporción p = 0.5 mientras que nuestra muestra es p0 = 31/50 = 0.62. WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 11

Si establecemos el nivel de significación α = 0.05 tendremos que la región de aceptación es el intervalo  0.5 ⋅ 0.5 0.5 ⋅ 0.5  , 0.5 − 1.96 = ( 0.361, 0.639 )  0.5 − 1.96  50 50 α = 0.05  Nuestro valor p0 = 0.62 entra dentro de este intervalo por lo que aceptamos la hipótesis nula H0. Sin embargo, si hubiesen salido 32 caras, entonces p0 = 32/50 = 0.64 y habría que rechazarla.

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 12

Contraste de hipótesis para la varianza de una población normal

Pruebas de ajuste Vamos a cambiar de registro. Hasta ahora siempre suponíamos que estábamos trabajando con poblaciones distribuidas mediante una normal N(µ,σ), lo cual efectivamente es muy habitual, pero puede ocurrir que nuestra pretensión sea saber si eso es cierto, es decir si un determinado experimento aleatoria se distribuye con una distribución de probabilidad F(x) o no. Para construir este modelo, supongamos que obtenemos una muestra a la que corresponde una distribución de frecuencias F*(x) y deseamos compararla con la distribución F(x). Lo que vamos a hacer es estudiar la diferencia de ambas distribuciones F(x) – F*(x). Si esta diferencia no es significativa aceptaremos la hipótesis nula H0 de que ambas distribuciones coinciden. Introducimos pues una nueva v.a. F(x) – F*(x) y vamos a estudiar su distribución de probabilidad en el caso que H0 sea verdadera. Cuando conozcamos esta distribución estableceremos un valor crítico c de tal manera que si la diferencia F(x) – F*(x) es menor que c aceptamos la hipótesis.

Prueba χ2 de Pearson Supongamos un espacio muestral Ω y un recubrimiento de k subconjuntos del mismo { Ai }i =1,..,k (recuerda que recubrimiento implica que son todos incompatibles dos a dos k

Ai I Aj = ∅, ∀i, j y que

U A = Ω ). i

i =1

Sea X una variable aleatoria

X Ω  →

A  → X ( A)

Tomamos una muestra de tamaño n mediante n observaciones de la v.a. X. Denominamos fj a la frecuencia con que ocurre la clase Aj es decir que llamamos probabilidad p j = P( Aj ) = P ( X ∈ Aj ) con lo cual el valor esperado de que ocurra Aj es npj. k

Consideramos el siguiente estadístico D = ∑

− np j )

obtenido mediante las diferencias np j entre la frecuencia observada y la esperanza teórica de las mismas. j =1

Se demuestra que este estadístico sigue una χ2 de Pearson con k-1 grados de libertad y, en la práctica, su funcionamiento es eficiente cuando npj ≥ 5

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 13

Ejemplo En uno de los resultados de los experimentos de Mendel, éste cruzó guisantes verdes con guisantes amarillos obteniendo una proporción de 25% guisantes verdes y 75% guisantes amarillos. Si realizamos nosotros nuestro experimento con 1000 guisantes, y obtenemos 275 guisantes verdes, ¿está nuestro experimento de acuerdo con la hipótesis de Mendel? Para comprobarlo, construimos nuestra v.a. dicotómica X Ω  →

0 Guisante amarillo → X ( A) =  A  1 Guisante verde donde P[X = 0] = 0.75 y P[X =1] = 0.25 . El numero de guisantes obtenidos en una muestra sigue una binomial B(n,p) y las tablas de probabilidad compradas con las frecuencias obtenidas en la muestra son: i=1: Guisantes i=2: Guisantes verdes amarillos n·p1 =1000·0.25=250 n·p2 =1000·0.75=750 Teórico n·pi f1 = 275 f2 = 725 Muestra fi (fi -n·pi)2 625 625 2 2.5 0.83 f − np

(

)

np j k

De donde D = ∑

− np j )

= 3.33 np j Esta v.a. sigue una χ2 de Pearson con 2-1=1 grados de libertad por lo que, considerando el nivel de confianza en α = 0.95 y consultando la tabla de la χ2 resulta un valor crítico c = 3.84 Como nuestro valor 3.33 < 3.84 podemos aceptar la hipótesis H0 j =1

Ejemplo 2 Se le ofrece a un estadístico una muestra de los pesos de 20 personas (el estadístico no sabe que se trata de 20 pacientes de un doctor que se encuentran en tratamiento por anorexia) y se le pide que nos diga, con un nivel de significación α = 0.05, si esta muestra pertenece a una población distribuída por una normal N(µ,σ). La muestra es: 37 41 40 39 36 38 37 36 43 43 36 36 43 36 37 39 40 41 39 43

El estadístico calcula la media muestral y resulta X = 39 Construimos una tabla de frecuencias tomando 5 intervalos: Intervalo 35-36

xi 35,5

n·pi

4 0,058 1,163

(fi - n·pi )

8,051

(fi-n·pi) /n·pi 6,924

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 14

37-38

37,5

5 0,136 2,715

5,220

1,922

39-40

39,5

5 0,161 3,217

3,178

0,988

41-42

41,5

3 0,097 1,934

1,136

0,587

43-44

43,5

3 0,029 0,590

5,809

9,848 5

D=∑ j =1

− np j ) np j

=20,270

Al ser 5 los intervalos el estadístico D tiende a una χ2 de Pearson con 5-1=4 grados de libertad, que a un nivel de significación de 0.05 consultamos en la tabla y obtenemos un valor crítico de 9.49 Como el estadístico D nos da 20.27 que es ostensiblemente mayor que el valor crítico 9.49, rechazamos la hipótesis de normalidad Sin embargo, observa que si desglosamos más y tomamos cada valor individualmente, como hay 8 valores distintos, los cálculos salen de esta manera: pi

n·pi

(fi - n·pi )

(fi-n·pi) /n·pi

4 0,077 1,532

6,093

3,978

3 0,117 2,341

0,435

0,186

2 0,151 3,019

1,038

0,344

3 0,164 3,286

0,082

0,025

2 0,151 3,019

1,038

0,344

3 0,117 2,341

0,435

0,186

0 0,077 1,532

2,346

1,532

3 0,042 0,846

4,640

5,486

4 0,077 1,532

6,093

3,978

3 0,117 2,341

0,435

0,186 8

D=∑ j =1

− np j ) np j

=12,079

Y ahora la χ2 de Pearson tiene 8-1=7 grados de libertad, que a un nivel de significación de 0.05 consultamos en la tabla y obtenemos un valor crítico de 14.1 y en este casi, si se aceptaría la hipótesis por ser el valor de D=12.08 menor que el valor crítico. No obstante, todos los cálculos previos no son correctos pues con una muestra de n = 20 no debemos aproximar la binomial por la normal (es aconsejable hacerlo a partir de WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 15

n > 30). Pero aparte de esto, el ejemplo es suficientemente didáctico para entender los procesos que debemos realizar.

Prueba de ajuste de Kolmogorov-Smirnov (K-S) Esta es una prueba no paramétrica que se utiliza exclusivamente para distribuciones contínuas y calcula la distancia máxima entre una prueba teórica y otra empírica. Al igual que la prueba Prueba χ2 de Pearson sirve para comprobar la bondad del ajuste entre ellas. Para realizar esta prueba se toma una muestra de tamaño n y se ordena de menor a mayor : x1 ≤ x2 ≤ ... ≤ xn

Consideramos ahora la función de distribución de la muestra *

F  →

si x<x1 0 k  x  si x j ≤ x ≤ x j +1 → F * ( x) =  n si x>x n  1 Se define la hipótesis a contrastar H0 : F y F* son la misma distribución Se define el estadístico D = max F * ( x ) − F ( x ) que está disponible tabulado

{

Para cada punto xk se calcula D ( xk ) = max Fn ( xk −1 ) − F ( xk ) , Fn ( xk ) − F ( xk )

}

Ayudándonos con las tablas y fijado un nivel de significación α, se determina el punto crítico c tal que

P [ D ≤ c] = 1 − α Si D ≤ c se rechaza la hipótesis nula H0

Ejemplo Libro [67], página 132

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 16

Contraste de hipótesis para la diferencia de medias Vimos que el intervalo de confianza para la diferencia de medias es

 σ 12 σ 2 2 σ 12 σ 2 2   X1 − X 2 − Z α  por tanto, este intervalo nos + , X1 − X 2 + Z α + 1− 1−   n n n n 1 2 1 2 2 2  α permite contrastar si cuando una diferencia de medias µ1- µ2 pertenece o no a este intervalo se pueda aceptar o rechazar la hipótesis H0

(

)

(

)

Ejemplo En el ejemplo previo de intervalos de confianza para la diferencia de muestras, habíamos calculado el intervalo de confianza para dos grupos de estudiantes de un instituto procedentes de familias con diferentes niveles económicos para intentar obtener alguna conclusión a ver si el rendimiento escolar pudiese estar relacionado con el nivel económico. Las hipótesis aquí son: H0 : Nivel económico no relacionado con rendimiento escolar H1 : Nivel económico si relacionado con rendimiento escolar El resultado del intervalod e confianza al 95% fue:

 6002 7002 6002 7002  + + , 400 + Z 0.975  400 − Z 0.975  = ( 80, 712 )95   40 30 40 30  95 Como el hecho de que no estén relacionados equivale a µ1- µ2 = 0 y el 0 no está incluido en el intervalo de confianza (80, 712) cabe concluir que hay algún tipo significativo de diferencias entre ambos grupos. Ejercicio En una muestra A de n1 = 7 enfermos se obtuvieron los siguientes tiempos de sueño 7, 5, 8, 5, 6, 7 y 8 horas. Se toma otro grupo B con n2 = 5 y se les aplica un tratamiento que ayuda a dormir y se obtienen los tiempos 9, 8.5, 9.5, 10, 8 horas. Suponiendo que la v.a. “tiempo de sueño” sigue una distribución normal N(µ,σ) calcula el IC al 95% y comprueba si el tratamiento es efectivo. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Los cálculos previos son Media muestral Grupo A

X 1 = 6.57

CuasiVarianza muestral 2 S n −1 2 = 1.62

Grupo B

X2 =9

S n −1 2 = 0.625 2

Se establece la hipótesis nula como H0 : El tratamiento es efectivo

( µ2 − µ1 > 0)

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 17

Estamos en el caso de querer estimar la diferencia de medias en el caso que no conocemos la varianzas poblacionales. Sabemos que en este caso se tiene que

)

− X1 − ( µ2 − µ1 )

→ tn1 + n2 − 2 n S + n2 S 22 1 1 + n1 + n2 − 2 n1 n2 Y que el IC que se obtiene es  1 1 1 1  + , X 2 − X 1 + tn1 + n2 − 2 S p +  donde  X 2 − X 1 − tn1 + n2 − 2 S p n1 n2 n1 n2 α  n S 2 + n2 S22 7 ⋅1.62 + 5 ⋅ 0.625 2 Sp = 1 1 = 1.2024 , y la tpor lo que resulta: S p = n1 + n2 − 2 7+5−2 Student con (7+5-2) = 10 grados de libertad al 95%, obtenida en la tabla, es tn1 + n2 − 2 = 1.81 , por lo que el IC resulta: 2 1 1

(

)

(

)

 1 1 1 1 + , ( 9 − 6.57 ) + 1.81 ⋅1.2024 ⋅ +  = (1.15, 3.70 )  ( 9 − 6.57 ) − 1.81 ⋅1.2024 ⋅ 7 5 7 5 95%  La media, al estar incluída en este intervalo con un 95% de probabilidad es positiva por lo que aceptamos la hipótesis nula H0

Ejercicio En un experimento se ha extraído una muestra de n = 1000 para establecer un patrón de lecturas normales N(µ,σ) de calcio (mg/ml sangre). Los resultados obtenidos fueron X = 9.5 y una varianza S n2 = 0.25 . Escribe el IC al 95% para la media poblacional µ. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución  S n −1 S n −1  ,X +t  X − tn −1,1− α ⋅  = ( 9.469, 9.531)95% α ⋅ n −1,1− n n   2 2

Ejercicio El ara-a es una substancia orgánica que actúa de agente antivírico. Para probar su eficacia en el tratamiento de la encefalitis por virus de herpes se administró ara-a a 100 pacientes afectados de los cuales murieron 28. Construir un IC al 95% de la proporción de fallecidos En estos pacientes la mortalidad natural es del 80%. Evaluar la eficacia de este tratamiento Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución (0.532, 0.668) WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 18

Ejercicio Dos atletas A y B van a recorrer la misma distancia de 20 Km en terreno llano . El atleta A hizo 29 pruebas con un tiempo medio X A = 90 min con una σ A = 6 min y B hizo 35 pruebas con una media de X B = 80 y σ B = 8 . Decide con un IC al 95% si B es mejor que A. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución (6.57,13.43)

Ejercicio Se lleva a cabo un estudio para investigar la capacidad de los monocitos en destruir células halladas en pacientes con cirrosis hepática, para conocer si la destrucción es mayor en estos últimos que en personas no cirróticas. Los resultados vienen dados por la siguiente tabla Desviacion Tamaño Media Grupo 1: Cirróticos

n1 =16

Grupo 2: No cirróticos n2 =9

X 1 = 44.2

σ 1 = 6.17

X 2 = 28.22

σ 2 = 4.11

Hallar un intervalo de confianza al 95% que nos permita decidir si es o no mayor dicha destrucción Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución En este ejercicio se trata de hacer un IC al 95% sobre la diferencia de medias µ1- µ2 y comprobar si estas pueden ser iguales Como son conocidas las varianzas dicho intervalo viene dado por X1 − X 2 − ( µ1 − µ 2 ) → N (0,1) σ 12 σ 22 + n1 n2

(

)

 σ2 σ2 σ2 σ2  De donde queda el IC:  X1 − X 2 − Z α ⋅ 1 + 2 , X1 − X 2 − Z α ⋅ 1 + 2  1− 1−  n1 n2 n1 n2  2 2  95% de donde:  6.17 2 4.112 6.17 2 4.112  , ( 44.22 − 26.22 ) + Z 0.975 ⋅ + +  ( 44.22 − 26.22 ) − Z 0.975 ⋅  = (11.96, 20.04 )9   16 7 16 7  95%

(

)

(

)

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 19

Si las medias fuesen iguales µ1= µ2 su diferencia sería µ1- µ2 = 0 y vemos que 0 no pertenece a este intervalo, luego cabe concluir que, efectivamente, la destrucción es mayor en pacientes cirróticos.

Ejercicio Se sabe que el nivel de colesterol medio de la población española es µ = 200 y su distribución sigue una N(200, σ = 16), sin embargo, se piensa que en una determinada zona el nivel es significativamente más alto y para confirmarlo o no se toma una muestra de tamaño n = 25 y resulta una media muestral X = 210 ¿Podemos afirmar con un nivel de significación (o error máximo) del 5% y con estos datos que la población de esta zona tiene el índice de colesterol significativamente más alto? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución 16   N  200,  y el IC al 95% es 25   16 16   , 200 + Z 0.975  200 − Z 0.975  = (193.72, 206.27 ) 25 25 95%  Como 210 cae fuera de este intervalo, podemos afirmar que en esta zona si tienen un colesterol más alto. Pero esta conclusión en estadística se le da la forma de un test de hipótesis de la siguiente manera: Queremos saber si la media µZ de esta zona Z de España tiene, o no, una media igual a la población global española de 200, es decir Hipótesis nula H0 : µZ = 200 Hipótesis alternativa H1 : µZ ≠ 200 Como µZ no pertenece al intervalo IC al 95% hallado rechazamos la hipótesis nula H0 y aceptamos la alternativa H1 , es decir µZ > 200 (es un test unilateral derecho) X

Ejercicio En una población de mujeres entre 45 y 54 años se ha extraído una muestra de n = 5000 mujeres con el fin de determinar con gran precisión la prevalencia de melanoma maligno. Se ha observado que 28 mujeres de la muestra presentaban esta enfermedad. Escribir el IC al 95% y el IC al 99% para la prevalencia de mujeres con melanoma. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Sabemos que la proporción se verifica que

p$ − p p (1 − p ) n

→ N (0,1) por lo que el

intervalo es

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 20

 28  28  28  28   1− 1−      5000  5000  28 5000  5000    28 − Z + Z 0.975 = ( 0.00353, 0.00767 ) , 0.975  5000  5000 5000 5000    95%

Es decir que la prevalencia del melanoma en mujeres de 45 a 54 años está entre el 3.53 por mil y el 7.67 por mil con un nivel de confianza del 5% El mismo intervalo pero al 99% resultaría:  28  28  28  28   1− 1−      5000  5000  28 5000  5000    28 − Z Z + = ( 0.00288, 0.00831) , 0.995 0.995  5000  5000 5000 5000    99%

Ejercicio En un hospital se opera a una serie de enfermos y, tras la operación, se quiere estudiar el efecto de un analgésico. A unos enfermos se le aplica el analgésico y a otros no y lo que se mide es el tiempo en el que el paciente deja de tener dolor, (v.a. X que supondremos normal) resultando la siguiente tabla 1 2 3 4 5 6 7 Tamaño Media Varianza

Grupo 1: 7 5

6 7 8 n1 = 7

Grupo 2: 9 8.5 9.5 10 8

n2 = 5

Muestral

X 1 = 6.57

Sn21 = 1.38

X2 =9

S n2 2 = 0.5

Construir el IC al 95% para la diferencia de medias para estimar si el tratamiento es o no es efectivo. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Nos encontramos en el caso de varianzas desconocidas y n pequeño, por lo que se usa X 2 − X1 − ( µ 2 − µ1 ) → t n1 + n2 − 2 ; con t0.975 = 2.23 y el intervalo de confianza que n1S12 + n2 S 22 n1 + n2 − 2 resulta viene dado por

(

)

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 21

 1 1 +  X 2 − X1 − tn1 + n2 − 2  n n2 1 

(

n1S12 + n2 S 22 1 1 , X 2 − X1 + tn1 + n2 − 2 + n1 + n2 − 2 n1 n2

)

(

)

n1S12 + n2 S 22 n1 + n2 − 2

  = ...  95%

 1 1 7 ⋅1.38 + 5 ⋅ 0.5 1 1 7 ⋅1.38 + 5 ⋅ 0.5  ... =  (9 − 6.57) − t10 , (9 − 6.57) − t10 + +  = ... 7 5 10 7 5 10   ... = (1.43 − 2.63 ⋅ 0.567,1.43 + 2.63 ⋅ 0.567 ) = ( 0.94,3.92 )95%

Como este intervalo no contiene al cero podemos afirmar que SI es efectivo

Ejercicio Se quiere saber si dos Laboratorios de Análisis que están midiendo el grado de dureza del agua lo hacen de forma homogénea (Suponemos que este grado de dureza sigue una N(µ,σ)). Para ello se les envían las mismas muestras de agua a ambos resultando los siguientes mediciones 1

Lab A

0.46

0.62

0.37

0.40

0.44

0.58

0.48

0.53

Lab B

0.82

0.61

0.89

0.51

0.33

0.48

0.23

0.25

0.67

Tamaño Media

0.88

CuasiVarianza

Muestral

n1 = 8

X 1 = 0.485

S n2−11 = 0.0074

n2 = 10

X 2 = 0.567

S n2−12 = 0.0622

Decidir con un IC al 90% si los dos analistas realizan mediciones análogas Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Es el mismo caso del ejercicio anterior donde hay que construir un IC para la diferencia de medias donde las muestras son pequeñas y las varianzas desconocidas. La t-Student con 16 grados de libertad y una significancia del 10% equivale a con t0.95 = 1.75 por lo que:  1 1 n1S12 + n2 S 22 1 1 n1S12 + n2 S 22  + , X 2 − X1 + tn1 + n2 − 2 +  X 2 − X1 − tn1 + n2 − 2  = ...   2 2 + − + − n n n n n n n n 1 2 1 2 1 2 1 2  90%

(

)

(

)

 1 1 7 ⋅ 0.0074 + 9 ⋅ 0.062 1 1 7 ⋅ 0.0074 + 9 ⋅ 0.062  ... =  0.082 − t16 + , 0.082 + t16 +  = ... 8 10 16 8 10 16   ... = ( 0.082 − 1.75 ⋅ 0.09, 0.082 − 1.75 ⋅ 0.09 ) = ( −0.07, 0.24 )90%

Revisar los calculos porque no coinciden Excel con apuntes Como el 0 está incluído en este intervalo podemos afirmar que ambos laboratorios hacen pruebas análogas. WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 22

Ejercicio Un laboratorio farmacéutico afirma que un antibiótico tiene una efectividad de 12 horas. Sin embargo, el clínico observa que, con sus pacientes, esto no ocurre. Para confirmarlo o refutarlo, toma una muestra de n = 40 pacientes y les mide a cada uno el tiempo de efectividad resultando un promedio de X = 10.5 horas. (Suponemos que la v.a. duración de la efectividad es una N(µ,σ=2) ¿Cumple el antibiótico la garantía? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Tenemos dos hipótesis H0 : El laboratorio tiene razón , luego la media de las muestras debe ser µ = 12 H1: El laboratorio se equivoca µ ≠ 12 Buscamos un estadístico adecuado para este test y elegimos estimar la media con un nivel de confianza del 95%. Al usar este estadístico el contraste es bilateral. Sabemos que el mejor estimador de la media es la media muestral que para n = 40 (n X−µ → N (0,1) por lo que el IC al 95% resulta ser: > 30) y σ conocida se tiene que σ/ n 2 2   ,12 + Z 0.975  12 − Z 0.975  = (11.38,12.62 )95% 40 40 95%  Nuestra media 10.5 queda fuera del intervalo pro lo que rechazo la hipótesis nula H0

Ejercicio Se sabe que para la población de recién nacidos la media poblacional de nivel de colesterol es µ0 = 175 y sigue una distribución N(175, σ=50). Queremos contrastar este dato con la media de recién nacidos de una determinada área geográfica porque sospechamos que se supera ese valor. Elegimos una muestra de recién nacidos en nuestra área de estudio y se obtuvo para   X−µ ella una media X = 200 y un Z0 = 1.58  Z 0 = = 1.58 N (0,1)  σ/ n   ¿Qué tipo de test de hipótesis usarías para contrastar esta teoría? A la vista de Z0 ¿El test ha sido significativo? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución Nuestra hipótesis nula es H0 : µ > 175 H1 : µ ≤ 175 Estamos ante un test unilateral derecho (la zona de rechazo es solo la cola derecha de la normal)

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 23

No conocemos el tamaño de la muestra n, pero sabemos que X−µ 1.58 ⋅ 50 Z0 = = 1.58 ⇒ n = = 3.16 ⇒ n = 10 200 − 175 σ/ n X−µ N (0,1) y el IC al 95% La media poblacional se estima mediante el estadístico σ/ n es: 50 50   ,175 + Z 0.975  175 − Z 0.975  = (144, 206 )95% , con lo que una media de 10 10 95%  X = 200 está contenida no confirma nuestra hipótesis nula, por lo que con los datos

que tenemos, debemos rechazarla y aceptar la alternativa H1 : µ ≤ 175 Esta mal ¡¡¡revisarlo!!!

Gil, J.; García, E. y Rodríguez, G. (1995). Estadística Básica Aplicada a las Ciencias de la Educación. Sevilla: Kronos. Ω ⌀ℕℤℚℝℂℙℐΩ⇐⇒⇔∊∉∈∅⇾≈≔≤≥ ξ∞

·∩∪∼∿⊂⊃⊆⊇⊄⋂⋃⊅∧∨Ω∀ℝ ξ s ↝N(μ = 80, σ = 10)

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 24

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 25