Universidad de Puerto Rico en Cayey Instituto de Investigaciones Interdisciplinarias
Introducción a la Estadística como herramienta de la Investigación José M Calderón Squiabro MSc., Ed.D Bioestadístico Proyecto BRIC
1 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estad铆stica
Investigaci贸n
2 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Investigación: • Es un proceso riguroso, cuidadoso y sistematizado en el que se busca resolver problemas, bien sea de vacío de conocimiento (investigación científica) o de gerencia, pero en ambos casos es organizado y garantiza la producción de conocimiento o de alternativas de solución viables.
3 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Etapas de investigación básica • PLANEACIÓN (Es precisar el problema) • DISEÑO DE LA INVESTIGACIÓN (objetivo, justificación, hipótesis, variables) • RECOLECCIÓN DE DATOS (Muestra, selección del instrumento, observación, encuesta, entrevista o cuestionario) • PROCESAMIENTO Y ANÁLISIS tablas (ordenación, clasificación, distribución) gráficas. • ANÁLISIS DE RESULTADOS (conclusiones, cumplimiento de objetivos, toma de decisiones) 4 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estadística • La Estadística se ocupa de los métodos y procedimientos para recopilar, clasificar, resumir, hallar patrones y analizar datos con la finalidad de ayudar a la toma de decisiones y formular predicciones.
5 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Como seleccionar la prueba estadística adecuada • Tipo de variables • Cuantitativa (tensión arterial) • Cualitativa (género)
• Tipos de preguntas de investigación • Asociación • Comparación • Factor de riesgo
• Estructura de datos • Independientes • Dependientes • Pareados José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
6
Variables y Escalas de Medida
7 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida •
En Estadística, cuando nos refiramos al concepto de Variable estamos hablando del carácter o fenómeno que estemos estudiando en la realidad. Las variables generalmente son de carácter cuantitativo, pero cuando estas sean de carácter cualitativo las llamaremos atributos. Ejemplos: • Presión Sanguínea Diastólica. • Frecuencia Cardiaca. 8
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida •
Cualitativas: –
•
Se utilizan para clasificar una cualidad o atributo de una característica de interés. Ejemplo la variable de estatus marital con las modalidades soltero, casado, divorciado, viudo, etc.
Cuantitativas – –
Sus modalidades son cantidades numéricas con las que podemos hacer operaciones aritméticas. Se dividen en: • •
Discretas: cuando no admiten un modalidad intermedia entre dos de sus modalidades. Ejemplo el número de pruebas de mamografía realizadas. Continuas: Cuando admiten una modalidad intermedia entre dos modalidades. Ejemplo peso al nacer. 9
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida • • • •
Escala Nominal. Variables Cualitativas Escala Ordinal. Escala de Intervalos. Variables Cuantitativas Escala de Razón o Proporción.
10
Medición : Asignación de números a atributos de una característica de interés. José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida 1. Escala Nominal • Escala de medición más baja. • Cuando la información dada se puede clasificar en categorías no numéricas mutuamente excluyentes, entre las cuales no se puede establecer ninguna relación de orden, por tanto, no se puede fijar ningún origen que sirva de referencia. Ej. Sexo, Estado Civil, Nacionalidad,…
11 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida 2. Escala Ordinal • Este tipo de medidas es igual a la escala nominal, pero se diferencian de éstas ya que en este tipo de escalas si se puede establecer algún tipo de orden, existiendo algún punto de referencia para tal ordenación. Ej. Nivel de Estudios, Edad por tramos, Nivel Socioeconómico 12 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida 2. Escalas de Intervalos • Más especializada que la nominal u ordinal, en el sentido que no solo es posible con esta escala establecer orden sino que en adicional considera la distancia la distancia entre dos mediciones cualesquiera. Ej. Temperatura (Celsius o Fahrenheit). La unidad de medición es el grado y el cero grado no implica ausencia de temperatura. 13 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variables y Escalas de Medida 2. Escalas de Razones • Tienen un punto cero fijo o no arbitrario. La escala de este tipo de datos utiliza intervalos definidos con precisión, igual que los datos de escala de intervalos, pero tienen un punto cero también fijo. Los datos medidos con una escala de razón constituyen el nivel más alto de la medida. Ej. Estatura, Peso 14 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Tabulaci贸n y Graficaci贸n
15 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Tabulación y Graficación • Todo análisis estadístico son estrategias para traducir la cantidad de información obtenida en la recolección de datos, a índices que sean interpretables y que representen alguna dimensión del comportamiento de las variables • La estrategia más sencilla es mostrar la información en un formato visual (gráficos) o en un esquema sintetizado (tablas)
16 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Tabulación de los datos • Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa. • Se recomienda su uso cuando se tienen grandes cantidades de datos
17 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estadísticos
Tabulación de los datos Número de años de escolarización
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total
Frecuencia 5 5 6 12 25 68 56 73 85 461 130 175 73 194 43 45 22 30 1508
Porcentaje ,3 ,3 ,4 ,8 1,7 4,5 3,7 4,8 5,6 30,6 8,6 11,6 4,8 12,9 2,9 3,0 1,5 2,0 100,0
Porcentaje acumulado ,3 ,7 1,1 1,9 3,5 8,0 11,7 16,6 22,2 52,8 61,4 73,0 77,9 90,7 93,6 96,6 98,0 100,0
Número de años de escolarización Válidos N 1508 Perdidos 0 Media 12,90 Mediana 12,00 Moda 12 10 Percentiles 9,00 20 11,00 25 12,00 30 12,00 40 12,00 50 12,00 60 13,00 70 14,00 75 15,00 80 16,00 90 16,00
≥20%?
≥ 90%?
18 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Representación gráfica de los datos • Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos. • Para datos cuantitativos agrupados en clases, comúnmente se utilizan dos gráficos: – Histogramas. – Polígono de frecuencias.
19 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Representaci贸n gr谩fica de los datos
Histograma
20 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Representación gráfica de los datos
Histograma y Polígono de Frecuencias
21 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Representación gráfica de los datos • Para datos cualitativos se usan: – Curvas – Barras – Sectores (Pie)
Curvas
22 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Representaci贸n gr谩fica de los datos
Barras Sectores, torta o circular
23 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Análisis descriptivo e inferencial
24 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Análisis descriptivo e inferencial 1. Estadística Descriptiva Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
2. Estadística Inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. 25 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Medidas Descriptivas Tendencia Central
26 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Tendencia Central • Centralización – Indican valores con respecto a los que los datos parecen agruparse. • Media, mediana y moda
27 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Media (Promedio) 1. Es la suma de todos los posibles valores de una variable, ponderada por las frecuencias de los mismos. 2. Ecuación (datos no están ordenados en tablas estadísticas): 3. Ecuación (datos ordenados en tabla estadística): Valores Variable x1
Frecuencia Absoluta n1
x2 ... xk
n2 ... nk 28
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Observaciones de la Media Es muy sensible a los valores extremos de la variable: ya que todas las observaciones intervienen en el cálculo de la media, la aparición de una observación extrema, hará que la media se desplace en esa dirección. Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias de Cayey el valor de la media puede no pertenecer al conjunto de valores de la variable; Por ejemplo µ = 2.5 hijos. 29 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Mediana • Llamamos Mediana al primer valor de la variable que deja por debajo de si al 50% de las observaciones. • Pasos para calcular la mediana: • Ordenemos en forma ascendente todos los datos de la variable. – Mediana de 1,2,4,5,6,6,8 es 5 – Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5 – Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. • Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7! 30 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Observaciones de la Mediana • Tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas. • Es de cálculo rápido y de interpretación sencilla. • El mayor defecto de la mediana es que tiene unas propiedades matemáticas complicadas, lo que hace que sea muy difícil de utilizar en inferencia estadística. 31 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Moda • Definición: Es el valor de la variable con
mayor frecuencia absoluta (el más que se repite). • Observaciones: • Es muy fácil de calcular. • Puede no ser único.
32 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Medidas Descriptivas Variabilidad o Dispersi贸n
33 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Variabilidad o Dispersión • Dispersión – Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. • Desviación típica, coeficiente de variación, rango, varianza
– Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
34 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Amplitud o Rango •
Se obtiene restando el valor más bajo de un conjunto de observaciones de una variable del más alto. Permite obtener una idea de la dispersión de los datos.
•
Posee varios inconvenientes: 1. No utiliza todas las observaciones (sólo dos de ellas) 2. Se puede ver muy afectada por alguna observación extrema 3. El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. 35
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Varianza y Desviación Estándar • Varianza: Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media. • Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media. • Notación: s2, σ2, var(X)
datos no en tablas estadísticas
datos en tablas estadísticas
36 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Varianza y Desviación Estándar La varianza no tiene la misma unidad que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en metros2). Si queremos que la medida de dispersión sea de la misma unidad que las observaciones bastará con tomar su raíz cuadrada. Por ello se define la desviación estándar, , como
37 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Medidas Descriptivas Medidas de Posici贸n
38 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Percentiles y Cuartiles • Posición – Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. • Percentiles, cuartiles,...
39 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Percentiles y Cuartiles 1. Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. 2. Hay tres cuartiles denotados usualmente: Q1 25% Q2 mediana (50%) Q3 75% 40 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Percentiles y Cuartiles 75% 25% 25% Mínimo
25% 75%
25%
Cuartil 1
Q1
25%
25%
Mediana Cuartil 2
Q2
Cuartil 3
Q3
Máximo
41 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Percentiles y Cuartiles • Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. • Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99. 42 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Percentiles y Cuartiles
20%
80%
Mínimo Percentil 20
Máximo
P20
43 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Diagrama de Caja y Bigotes (boxplot)
Max
Min
Q1
mediana
Q3
Escala Los diagramas de caja y bigotes son herramientas gráficas muy útiles para describir características importantes en un conjunto de datos, como son 44 centro, simetría o asimetría, valores atípicos (raros), etc. José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Coeficiente de Variación: • Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.
45 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Medidas Descriptivas Escala de Medida
Características
Estadísticas apropiadas
Nominal
Clasificación única
Moda
Ordinal
Jerarquización o calificación
Mediana, percentiles
Intervalo
Diferencia conocida entre dos puntos cualesquiera
Media, Desviación estándar
Razón
Diferencia conocida entre dos puntos cualesquiera cero único o verdadero
Media, Desviación estándar
46 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Análisis descriptivo en investigaciones
• Data were analyzed using descriptive statistics, such as mean, standard deviation and frequency distributions.
47 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
¿Cómo elegir entre métodos paramétricos y no paramétricos?
48 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estadisticas Noparametricas • Cuando la población desde la cual fueron tomados los datos no tiene distribución normal (o no es compatible con otros supuestos como por ejemplo la igualdad de varianza entre los grupos de tratamiento), la media y la desviación estándar ya no son confiables como descriptores de la población y los métodos paramétricos dejan de ser confiables. • La Estadística no Paramétrica es una alternativa de análisis de datos y no una salida para situaciones “anormales” de las poblaciones.
49 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estadística no paramétrica • Utilizan una transformación de rangos • Se usan cuando la distribución de las variables es fuertemente sesgada o cuando la naturaleza de los datos es ordinal • Compara medianas (no medias) Estadística paramétrica
Estadística no paramétrica
Prueba t
Prueba de Mann-Whitney
Prueba t pareada
Prueba de rangos con signo
ANOVA un factor
Prueba de Kruskal-Wallis
ANOVA dos factores
Prueba de Friedman 50
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Inferencia Estadística
51 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Estadística inferencial • La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). • La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto. 52 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Utilidad de la Inferencia • La utilidad de la inferencia estadística, consiste en que si el modelo se considera adecuado, puede usarse para la toma de decisiones o para la realización de las previsiones convenientes. • En el desarrollo del tema se utilizarán variables aleatorias, que son variables determinadas por el azar.
53 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
INFERENCIA POBLACIÓN
Muestra
54 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Muestreo • Muestra: Subconjunto de los elementos de una población. • Objetivo: Poder describir la población de partida. Para ello, la muestra debe ser representativa de su correspondiente población. • Es importante aprovechar la información de la muestra en un análisis descriptivo antes de efectuar inferencias sobre la población. 55 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
El uso extendido de la distribución normal en las aplicaciones estadísticas tiene diferentes razones. • Muchos de los procedimientos estadísticos habitualmente utilizados asumen la normalidad de los datos observados (p. e. el muestreo). Si bien esta hipótesis puede obviarse cuando se dispone de un número suficiente de datos, resulta recomendable contrastar siempre si se puede asumir o no una distribución normal. • La simple exploración visual de los datos puede sugerir la forma de su distribución. No obstante, existen medidas, gráficos y contrastes de hipótesis que pueden ayudarnos a decidir, de un modo más riguroso, si la muestra de la que se dispone procede o no de una distribución normal. • Cuando los datos no sean normales, podremos o bien transformarlos o emplear otros métodos estadísticos que no exijan este tipo de restricciones (los llamados métodos no paramétricos).
56 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Algunos Procedimientos Inferenciales comunes
57 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Prueba t • Compara las medias de una variable continua en muestras para determinar si o no la diferencia entre las dos medias esperadas excede la diferencia que debería ser esperada por azar ¿Qué probabilidad hay de que las medias difieran?
58 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Prueba t
Requerimientos • Las observaciones son independientes • Extraídas de poblaciones normalmente distribuidas • Tamaño de muestra <30 si es mayor a 30 usar la prueba de z de la distribución normal (prueba binominal) 59 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Tipos de pruebas t • Prueba t para una muestra: prueba si la media de la muestra de una variable difiere significativamente de la media conocida de la población • Prueba t no pareada o independiente: prueba si las medias estimadas de la población por 2 muestras independientes difieren significativamente (grupo de hombres y grupo de mujeres) • Prueba t pareada: prueba si la media estimada de la población por muestras dependientes difieren significativamente (media de pre y post-tratamiento para el mismo grupo de pacientes. 60 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Correlación y regresión • Métodos para estudiar magnitud de la asociación y la relación funcional entre dos o más variables.
61 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Correlación
• Denota fuerza de relación entre variables
62 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Mediciones - Correlación • Si paramétrica • Coeficiente de correlación de Pearson »Variables continuas »Relación lineal • Si no paramétrica • Rank de Spearman rank »Ambas variables son continuas • Tau de Kendall »Dos ordinales o una ordinal y una continua José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
63
Regresión • Método que indica una relación matemática entre una variable dependiente y una o más variables independientes • Regresión lineal simple y regresión múltiple son apropiadas para variables como tensión arterial, peso. • Regresión logística es aplicable para respuestas binarias como vivo/muerto 64 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Anova • Es usada para descubrir el efecto principal y los efectos de interacción de variables categóricas independientes (llamados factores) sobre un intervalo de la variable dependiente. • Anova de una via prueba diferencias en un intervalo de la variable dependiente entre dos, tres o más grupos formados por las categorías de una variable categórica independiente. 65 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Pregunta de investigación Asociación de 2 variables (dep, indep) Tipos de variable Prueba Dependiente independiente
categórica
categórica
chi-cuadrada
categórica
cuantitativa
Regresión logística
Cuantitativa
categórica
2 Prueba T +3 ANOVA
Cuantitativa
Cuantitativa
Correlación Spearman Regresión lineal 66
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Comparando variables (diferencias) Variable
N煤mero de variables independientes 2 grupos datos pareados >2grupos
Cuantitativa Prueba t Ordinal Categ贸rica
MannWhitney chicuadrada*
Prueba t pareada
Wilcoxon McNemar
ANOVA Kruskal wallis chicuadrada
* Cuando 1 celda tiene <5 esperados, se usa prueba exacta de Fischer Cuando 1 de las celdas tiene <5 observados, se usa corregida de Yates 67 Jos茅 M Calder贸n Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Análisis inferencial en investigaciones Descriptive analyses were used to estimate the prevalence of dropout. Chisquare test of independence was used to assed the association between school dropout, sociodemographic and risk factors. Multiple logistic regression analysis…
68 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Gracias por su Atención • Horario de Oficina – Lunes y Martes: 9:30 A.M. a 12:00 P.M. – Jueves y viernes: 1:00 P.M. a 4:00 P.M.
• Correo electrónico: jose.calderon6@upr.edu • Teléfono: (787) 738-2161 x 2616,2615
69 José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
¿ Que se debe tener en cuenta para seleccionar la prueba estadística? OBJETIVOS
Comparar medias
Tipo de Variable
Escala de Medición
Cuantitativa
Intervalo/ Razón
PRUEBAS
• •
Prueba t (2 grupos ) Prueba ANOVA (≥ 2 grupos )
Cuantitativa
Intervalo/ Razón
Coeficiente de Correlación de Pearson; Coef. Spearman
Predecir la VD, a partir de la VI
Cuantitativa
Intervalo/ Razón
Regresión
Independencia de variables (Asociación)
Cualitativa
Nominal , Ordinal
Fuerza de Asociación
Cualitativa
Nominal , Ordinal
Comprobar si existe asociación entre variables
José M Calderón Squiabro, UPR Cayey, Instituto de Investigaciones Interdisciplinarias
Chi
2
Odds Ratio – Riesgo Relativo
70