PRUEBAS DE YNORMALIDADMUESTREO
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/58ba052944b8a710b421ef6a090065d0.jpeg)
PRUEBAS DE NORMALIDAD PARA VARIABLES CUANTITATIVAS
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/46c5ef85b3ee240e363d697cb479ea83.jpeg)
Tarea ¿Qué vamos a comparar? Variable cuantitativa dependiente Variable cuantitativa independiente Como hay que hacer 2 ejercicios vamos a coger 4Variablevariables Ejercicio 1 independienteCualitativadependienteCuantitativa PrácticasPeso deporte Ejercicio 2 N0 SexoCigarrillos
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/65736e9c49fb285316f31366ca266222.jpeg)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Prácticas deporte será nuestra variable cualitativa dependiente.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Ejercicio 1 Prácticas de deporte-peso
Peso será nuestra variable cuantitativa independiente
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/1bd8ebb29a4b84daa6609db789ee2895.jpeg)
P < 0,05 =RECHAZO hipótesis nula (se acepta la alternativa) – NO DISTRIBUCIÓN NORMAL
Pruebas de normalidad prácticas de deporte-peso
Las pruebas de normalidad se utilizan para saber si una variable se distribuye normalmente.
P > 0,05 = ACEPTA hipótesis nula – DISTRIBUCIÓN NORMAL
¿CÓMO SABEMOS QUE UNA VARIABLE SE DISTRIBUYE NORMALMENTE?
En estos test, (cualquiera de los dos), la H0 indica que los datos de la variable siguen una distribución H1,normal.indica que el conjunto de variables NO sigue una distribución normal.
Para variables continuas, dibujamos el histograma y si nos sale similar a la campana de Gauss o tienen cierta simetría, aún no sabemos con exactitud si son normales. Para ello se utilizan 2 pruebas
2. Para N<50, utilizamos el test de Shapiro-Wilks
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
NO PARAMÉTRICAS:1.ParaN>50, utilizamos el test de Kolmogorov-Smirnov
¿Qué nos dice que tenemos que aceptar o rechazar la hipótesis nula? – El valor de p
Pruebas de normalidad prácticas de deporte-peso
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
¿Cómo hacer la prueba de normalidad en SPSS?
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/a705e65ca603f999cf472d7c7fbc72c9.jpeg)
Pruebas de normalidad prácticas de Resultadosdeporte-peso
Nos fijamos en la prueba de Shapiro - Wilk, ya que N<50
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/87eb3f075fe3cc0125be492eb0a60fdf.jpeg)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Podemos observar que en ambos casos, tanto para los que practican deporte como para los que no, p> 0,05 y, por tanto, se ACEPTA la hipótesis nula, es decir, que los datos de las variables siguen una distribución normal.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Pruebas de normalidad prácticas de deporte-peso
Conclusiones
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/6346883b1b0778f9b22357a0bd0cb5a2.jpeg)
Histograma sobre: Practicar - Deporte - NO 56 kilos
Histograma sobre: Practicar - Deporte - SI 47 kilos
Peso Frecuencia 1086420 40 60 80 100 Mediana:
Peso Frecuencia 1086420 20 40 60 80 100Promedio:
Pruebas de normalidad prácticas de deporte-peso Gráficos obtenidos en las pruebas de normalidad
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Pruebas de normalidad prácticas de deporte-peso
Los gráficos de puntos nos indican una distribución normal porque se alinean siguiendo un patrón
50 60
Gráfico Q-Q normal de peso para practicar deporte peso - Si -4-2420 60 80
40
100
Valor observado
Valor observado
Gráfico Q-Q normal sin tendencia de peso para practicar deporte peso - Si normaldeDesviación 0,000,700,500,200,10 20 30 40 50 60 80
Gráfico Q-Q normal de peso para practicar deporte peso - No -2-10231-3 20 30 40
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
esperadoNormal
Valor observado
10
esperadoNormal
10
MUESTREO
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/5e816f947e10e91524d026656407529a.jpeg)
Muestreo de una población.
Contenido
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
La precisión de las estimaciones de muestras no aleatorias
El enfoque estadístico para evaluar qué tan buenas son las conclusiones extraídas de una muestra.
Conducir a los intervalos de confianza como una declaración de la precisión de las estimaciones obtenidas de una muestra aleatoria
Cuando hay una gran cantidad de sujetos, generalmente es imposible medir a todos.
Por lo general, incluya un número más pequeño (una muestra) en nuestro estudio Queremos generalizar los hallazgos de la muestra y sacar conclusiones que se apliquen más ampliamente.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/010ad105935c2db6c25d0c2986c999f9.jpeg)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Muestreo
¿Por qué tomar una muestra?
El grupo que deseamos estudiar se denomina POBLACIÓN y está formado por un gran número de Tomamossujetos una MUESTRA de un número mucho menor de sujetos
Ocasionalmente se toma una muestra de toda la población, esto se llama CENSO
La situación más simple para describir el proceso es estimar la media de una variable continua esta situación cubierta ahora
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Población
Se desconoce la media, μ Seleccionar individuos de la población para incluirlos en la muestra Tomar medidas en estadísticasCalcularmuestraMediaX=50demuestra Con qué precisión se estima la media de la población a partir de una muestra de este tamaño ¿ ?
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Muestra
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d0ed2db5ad3eea83cef8272376a918.jpeg)
La muestra es un número representativo de la población que nos permite hacer inferencias de manera segura.
Frecuencia 1086420 20 40 60 80 100
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
El grupo sobre el que deseamos hacer declaraciones (podrían ser todos los pacientes con la enfermedad que estamos estudiando)
Terminología μ
POBLACIÓN
Distribución de variable en muestra descrita por ESTIMACIONES – media - x.
MUESTRA
En la población hay una gran cantidad de sujetos - N
La variable que nos interesa tiene una distribución desconocida en la población descrita por PARÁMETROS - media – μ
Parámetros de población (Griego)
μ σ
DesviaciónMedia Estandar
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Siempre desconocidoserá“Verdadero"
Estimaciones de muestra (Romano)x S, SD, STD (STandard medidasConocidoDeviation)unavezquesetomanlasenlamuestra
Teoría estadística que dice qué tan precisa la estimación depende del tamaño de la muestra
¿Es representativo de la población?
¿Cómo se tomó la muestra?
La calidad de la media muestral (x) como estimación de la media poblacional (μ) se rige por:
Abordado al final de la sesión
Abordado en las próximas diapositivas
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Frecuencia 1086420 20 40 60 80 100 σ
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
μ
Estimaciones de muestra x & SD Supongamos que se tomó una segunda muestra con x₂ & SD₂
La teoría estadística se basa en muestras repetidas hipotéticas
Cada muestra repetida produciría valores diferentes para x y SD
Y una tercera x₃ & SD₃
Esta desviación estándar tiene un nombre especial: el error estándar (SE)
SE μ Distribución de medias muestrales
La teoría estadística nos dice que la distribución de las medias muestrales es una NORMAL con:
Desviación estándar relacionada con la población σ, pero también dependiente del tamaño de la muestra, n
Media igual a la media poblacional µ abordada más tarde
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
SE=
Las medias de muestras GRANDES son menos variables que las de muestras pequeñas SDn
Segundo nivel
Cuando la variable en sí tiene una mayor dispersión (mayor σ y, por lo tanto, SD muestral), también tienen medias muestrales repetidas.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
La media de nuestra muestra probablemente (95%) caerá en este rango
Segundo nivel μ
Rango del 95 % para las medias de la muestra
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
μ
Podemos concluir que un rango de +/- 1.96SEs centrado en x es probable que cubra la media desconocida μ con la misma probabilidad del 95% x 1.96 x SE+-
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
[ [
Cuando tomamos una muestra, sabemos x pero no μ, pero dado que estamos seguros en un 95% de que x cae dentro de 1.96 SE de μ.
La teoría se basa en SE=σ/√n.
Nota: Uso de valores t
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
En la práctica, σ se reemplaza por la muestra SD.
La fórmula para un IC del 95%: x 1.96 X SE.
σ es la desviación estándar de la población desconocida.
Pero hay penalti1,96 de la distribución normal se reemplaza por un valor correspondiente de otra distribución (la distribución t). +-
Para la mayoría de los tamaños de muestra IC X 2 x SE+-
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/84ff691a0d45c37d6af1473dcb00e1e6.jpeg)
La penalización por reemplazar σ desconocido por SD conocido depende del tamaño de la muestra
Un paquete estadístico hará esto por usted
El valor a usar está etiquetado como tn-1 (0.975)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
95% Rango normal 95% Intervalo de Confianza x ±1.96 SD aprox. x ± 2 SD x ± tn 1(0.975) SE aprox. x ± 2 SD/√n
el rango cubre la media "verdadera" el 95% del tiempo (muestras repetidas hipotéticas)
Comparación entre el rango normal del 95 % y el intervalo de confianza del 95 % para la media
95% de los valores de la variable se encuentran dentro del rango
describe la dispersión de datos da precisión de la media estimada
D es para datos, distribución, descripción
SD
SE E es para estimación
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
μ X1 X2 X3 SE μ
La teoría estadística dice que cuando una variable sigue una distribución Normal en la población, las medias muestrales repetidas seguirán una distribución Normal.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
PERO – también se aplica cuando la variable NO sigue una distribución normal en la población
Es posible que prefiera presentar una medida diferente de tendencia central, por ejemplo, la mediana: esta teoría no se aplica
Distribuciones no normales, la teoría se aplica solo a muestras grandes, digamos n> 30 También"Asintótico“se relaciona con la población y las medias muestrales.
μ X1 X2 X3 SE μ X
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Qué tan bien la media muestral (x) estima la media poblacional (μ) se rige por:
Teoría estadística que relaciona la precisión de la estimación de la muestra con el tamaño de la muestra.
¿Es representativa de la población?
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d0ed2db5ad3eea83cef8272376a918.jpeg)
HECHO
¿Cómo se tomó la muestra?
Abordado en las próximas diapositivas
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
¿Cómo seleccionar una muestra que sea representativa de la población?
2. Generar n números aleatorios entre 1 y N (omitiendo repeticiones)
Pasos para obtener una muestra aleatoria
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/eeafea87f4ba759d99240fa4b94e294a.jpeg)
1. Enumere y numere a todos en la población (1…N)
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
En una muestra aleatoria, cada miembro de la población tiene la misma oportunidad de ser seleccionado.
3. Los miembros de la población con uno de los n números seleccionados están en la muestra
SE μ X
El sobre muestreo de individuos de las regiones más altas o más bajas de la población da como resultado un SESGO
Que la media de la distribución de las medias muestrales sea igual a μ está directamente relacionado con que la muestra sea representativa de la población
Las medias de la muestra se centran en un valor distinto de μ
μ X1 X2 X3
Definición de SESGO:
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Muestra de machos y hembras por separado
Muestrear los conglomerados
Muestreo estratificado
Los individuos de la población caen en estratos (por ejemplo, 60% mujeres, 40% hombres)
Los individuos se agrupan en grupos en la población
Otros esquemas para el muestreo de una población
Se puede realizar un análisis ponderado para garantizar que las estimaciones no estén sesgadas y con los errores estándar correctos
Incluir a todos los individuos en los grupos seleccionados
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)
Muestreo por conglomerados
Asegurar una proporción de 60:40 de mujeres: hombres en la muestra o para asegurar 50:50 hembras: machos en la muestra
Los investigadores a menudo abordan el tema de la generalización en la discusión
A los pacientes con enfermedad más o menos grave?
Pacientes en Europa? ¿los Estados Unidos?
A los pacientes en la práctica general en el Reino Unido?
¿Los hallazgos del estudio de una clínica en el SGH se generalizan a clínicas similares basadas en hospitales en las grandes ciudades del Reino Unido?
No hay una población clara (no se pueden enumerar todos los miembros)? Correspondencia entre la verdadera media de la población y el centro de distribución de las medias de las muestras.
En las ciencias médicas, un método de muestreo comúnmente utilizado es el muestreo por conveniencia
Incluir a todas las personas que asisten a una clínica durante el período de reclutamiento del estudio.
Generabilida no basada en la teoría estadística.
![](https://assets.isu.pub/document-structure/220920234100-5146bd60b43fa696c14144346a9f5dc6/v1/b8d3e957414d66edb0367be1ae1437d3.jpeg)