ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES Seminario
Facilitador: M.Sc. Jimmy Delgado Villca
OBJETIVOS Introducir a los participantes en las nociones generales de la estadística y su utilidad en las Ciencias Sociales. Demostrar mediante ejemplos prácticos la aplicación y uso de la estadística en el análisis de datos.
CONTENIDO
Nociones generales de la Estadística Definición de la estadística y su utilidad Población y muestra Variables Cualitativa y Cuantitativa División: estadística descriptiva e inferencial Aplicación de la estadística en la actualidad con apoyo de programas informáticos. Muestreo Fórmulas de tamaño de muestra Técnicas de muestreo probabilístico y no probabilístico Análisis Estadístico con apoyo de programas digitales (Excel, SPSS y Google Drive) Técnicas descriptivas Tablas y gráficos Medidas descriptivas Contraste de hipótesis Chi – cuadrado Correlación lineal T de Student Análisis de varianza
Nociones BĂĄsicas sobre EstadĂstica
Facilitador: M.Sc. Jimmy Delgado Villca
1. Definición de Estadística La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado")y de su derivado italiano statista ("hombre de Estado" o "político"). El término alemán Statistik, introducido por Gottfried Achenwall (1749), designaba originalmente el análisis de datos del Estado, es decir, "la ciencia del Estado". No fue hasta el siglo XIX cuando el término estadística vino a designar la colección y clasificación de datos. En su origen, por tanto, la estadística estuvo asociada al control de datos poblacionales por parte de la administración pública.
“Ciencia que se ocupa de un conjunto de métodos científicos, técnicas o procedimientos para recopilar, organizar, presentar y analizar datos, con el propósito de sacar conclusiones válidas y tomar decisiones más razonables y confiables cuando prevalecen condiciones de incertidumbre.” (Spiegel, 1991:1)
“Es una ciencia pura y aplicada que se ocupa de recolectar, procesar, analizar e interpretar datos que sirven para la toma de decisiones en una investigación.” (Gutierrez, 2004:7)
Ejemplos de aplicación de la Estadística en diferentes disciplinas 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares. 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población
2. Población y Muestra a) Población (N) Es el conjunto de todas las unidades de observación o elementos (personas, instituciones, organizaciones, animales, objetos, sucesos, etc.) que tienen por lo menos una característica en común, la cual se desea estudiar. Dependiendo del número de elementos que la conforman, una población puede ser finita o infinita. Ejemplos: 1.- Pobladores de la provincia Campero del Dpto. De Cochabamba. 2.- Estudiantes de la carrera de Cs. de la Ed. 3.- Las unidades educativas del municipio Cercado.abamba.
4.- Centros de salud de la municipio Quillacollo.
b) Muestra (n) Cualquier subconjunto, parte, sector o segmento de unidades elementales, elegidas de una población; la cual debe ser representativa. Ejemplos: 150 familias de una ciudad. 20 Centros educativos elegidas de una región
3. Variable Variable: Propiedad o característica de alguna cosa que puede asumir más de un valor. Es toda característica que puede tomar diferentes valores, o puede variar de un sujeto a otro o de un momento a otro en el mismo sujeto. Ej. Talla, Religión, Estado Civil, Peso, etc. Constante:
No asume diversos valores. Ej. π = 3,1416……... Días de la semana, Horas del día, letras de alfabeto.
Variable Cualitativa Llamadas también variables categóricas. Su expresión es literal, además expresa una cualidad o atributo, el número de categorías que generalmente presentan es determinado.
¿Qué tipo de música escuchan?
Cualitativa Nominal
Ejemplos: Nacionalidad, Colores, Lugar de nacimiento, Deportes, programas de TV, Tipo de colegio, profesión, etc. Ej: Tipo de Música: a) Clásico b) Rock c) Regatón d) Cumbia e) Romántico f) Otros
Cualitativa Ordinal
Ejemplos: Nivel de ingresos, Tamaño, Rendimiento académico, Nivel de desnutrición, calidad del producto, etc. Ej: Nivel de autoestima: a) Alto b) Medio
c) Bajo
Cualitativa Dicotómica (Binarias)
Ejemplos:
Gusto por las Música: Si No Sexo: Masculino Femenino Edad: Menor de 21 años Mayor a 21 años
Cualitativa Politómica
Ejemplos:
Nacionalidad: - Boliviano - Argentino - Brasilero - Peruano - Otros
-
Ocupación: Profesor Albañil Carpintero Abogado Otros
Variable Cuantitativa Su expresión es numérica, variables susceptibles de medición, el número de valores que asume es indeterminado, de acuerdo a la precisión de la medición. Ej. 1 hr. 60 minutos, 60 segundos, etc.
¿Cuántos libros tienen en casa?
Cuantitativa Discreta (Valores enteros CONTEO) Ejemplos: # de alumnos por curso, # de cursos de capacitación realizados, # de amigos, # de hermanos, # de docentes por carrera, etc. Ej: Número de Hijos: 0 – 1 – 2 – 3 – 4 – 5 – 6 – 7 – 8, etc. Cuantitativa Continua (Valores enteros y decimales - MEDICIÓN) Ejemplos: Horas de estudio, temperatura, volumen, distancia, talla, edad, salario, cantidad de agua consumida por día, etc. Ej: Peso: 50 Kg; 62,5 Kg; 72,234 kg, etc.
4. Clasificación de la Estadística 4.1. Estadística Descriptiva: Reduce gran cantidad de datos a pocas medidas estadísticas. Explica o describe las características de la población que se esta estudiando, las mismas que son solo validas para esa población. No generaliza resultados.
1000 datos sobre edad
POBLACION 1000 alumnos
Promedio = 21 años
Llamada también DEDUCTIVA, se ocupa de la recopilación, procesamiento, presentación (mediante cuadros y gráficos), análisis e interpretación de un grupo de datos, sin ningún intento de hacer una predicción basada en los datos.
EJEMPLOS: DISTRIBUCIÓN DE JÓVENES EGRESADOS Continuación de estudios superiores Sin Inserción 6% 13%
Autoemprendimiento 2%
Contratación 79% Fuente: Centro de Formación Técnica Laboral para Jóvenes, Cbba.-Bolivia. 2011
Porcentaje de participación según sexo 50,00%
46,88%
45,00%
40,21%
40,00%
35,00% 30,00% 25,00% 20,00%
12,60%
15,00% 10,00% 5,00%
0,13%
0,17%
0,00%
Hombres
Hombres con discapacidad
Mujeres
Mujeres con hijos < a 7 años
Mujeres con discadacidad
Fuente: Centro de Formación Técnica Laboral para Jóvenes, Cbba.-Bolivia. 2011
BOLIVIA: CENSOS
CENSO
POBLACIÓN
1900 1950 1976
1’766.451 3’018.031 4’613.486
1992 2001 2012
6’420.792 8’274.325 10’389.913
Fuente: Instituto Nacional de Estadística, Bolivia
Técnicas de la Estadística Descriptiva a) Tablas o Cuadros
b) Grรกficos
Diagrama de Barras Simple UMSS: MATRICULA ESTUDIANTIL POR FACULTADES - GESTIÃ&#x201C;N 2008 285
300
269
250 200 145
150
146 112
96
100
50
131
124
46 26
0
Fuente: Universidad en cifras, 2008
19
19
33
26 9
c) Medidas Descriptivas
4.2. Estadística Inferencial: Reduce una gran cantidad de datos a pocas medidas estadísticas a partir de una muestra representativa, la cual resume las características mas relevantes de la población. Generaliza resultados a poblaciones mayores.
POBLACIÓN 60.000 alumnos De la UMSS
MUESTRA 500 alumnos
500 datos sobre edad
Promedio 21 años
Proceso de Generalización de resultados Llamada también INDUCTIVA, se ocupa de estudiar las inferencias hechas a partir de una información parcial, así como las condiciones que rigen su validez. Incluye los métodos de generalización, estimación o predicción de características de la población, basadas en una muestra.
BOLIVIA: POBLACIÓN TOTAL PROYECTADA
AÑOS
TOTAL
2000
8.427.789
2005
9.427.219
2010
10.426.154
2015
11.410.651
2020
12.362.780
2025
13.268.462
2030
14.114.508
Fuente: Instituto Nacional de Estadística, Bolivia
Técnicas de la Estadística Inferencial
5. Programas Estadísticos Un paquete estadístico es un conjunto de programas informáticos específicamente diseñados para el análisis estadístico de datos con el objetivo de resolver problemas de estadística descriptiva, inferencial o ambos.
6. Muestreo Procedimiento de gran validez con el cual se seleccionan las unidades representativas, a partir de las cuales obtendrรก los datos que le permitirรกn extraer inferencias acerca de una poblaciรณn.
6.1. Tamaño de Muestra a) Fórmula para poblaciones finitas Esta fórmula se aplica cuando se conoce exactamente el tamaño de la población.
Z N pq n 2 2 ( N 1)e Z p q 2
Donde: N = Tamaño de la población n = Tamaño de Muestra Z = Puntuación tipificada del 95% de Nivel de Confianza
p = Variabilidad positiva (probabilidad de éxito) q = Variabilidad negativa (probabilidad de fracaso) e = Precisión o error
Fuente: http://ocw.innova.uned.es/ocwuniversia/psicologia/analisis-dedatos-en-PsicoI/Ejercicios/ejercicios/aplicacionesDM/solucion_5.htm
Ejemplo: La carrera de Psicología de la UMSS tiene 1792 estudiantes (Gestión II/2016). Considerando que se quiere realizar un estudio sobre uso de redes sociales, calcular una muestra para un margen de error del 6% y una proporcionalidad del 85%.
Z2 N pq n ( N 1)e 2 Z 2 p q 1,96 2 1792 0,85 0,15 n (1792 1)0,06 2 1,96 2 0,85 0,15 877,7288 877,7288 n 126,52 6,4476 0,4898 6,9374 n 127
b) Fórmula para poblaciones infinitas Esta fórmula se aplica cuando no se sabe exactamente el tamaño de la población.
Z pq n 2 e 2
Donde:
n = Tamaño de Muestra Z = Nivel de Confianza p = Variabilidad positiva (probabilidad de éxito) q = Variabilidad negativa (probabilidad de fracaso) e = Precisión o error
Ejemplo: Se busca realizar un estudio en la ciudad de Cochabamba entre personas que viven en situación de calle, calcular un tamaño de muestra para un margen de error del 8%.
Z p q 1,96 0,5 0,5 n 2 2 e 0,08 0,9604 n 150 , 0625 2 0,0064 n 150 2
2
6.2. Selección de Técnicas de Muestreo
Muestreos Probabilísticos (Cuantitativos)
Muestreos No Probabilísticos (Cualitativos)
-Aleatorio simple -Aleatorio sistemático -Estratificado -Por conglomerados -Polietápico -Por conveniencia o intencional -Por cuotas -Secuencial -Bola de nieve -Por criterios de exclusión
Muestreos Probabilísticos Aquel en el que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo este método de muestreo probabilístico nos asegura la representatividad de la muestra extraída y es, por tanto, el más recomendable por ser riguroso y científico.
Muestreos No ProbabilĂsticos El investigador puede seleccionar los elementos a estudiar segĂşn su juicio personal, sin hacer usos de las leyes del azar.
1) Muestreo Aleatorio Simple El muestreo aleatorio simple se puede aplicar en muchos métodos. El más primitivo y mecánico sería el de la lotería. A cada miembro de la población se le asigna un número. Todos los números se colocan en un recipiente o un sombrero y se mezclan. Con los ojos vendados, el investigador va sacando las etiquetas con números. Todos los individuos que tengan los números sacados por el investigador son los sujetos del estudio.
Otra forma sería que una computadora haga la selección al azar de la población. En el caso de poblaciones con pocos miembros, es aconsejable utilizar el primer método, pero si la población tiene muchos miembros, es preferible una selección aleatoria por computadora
2) Muestreo Aleatorio Sistemático Es una técnica de muestreo aleatorio que se utiliza con frecuencia por su sencillez y calidad regular. En este muestreo el investigador primero escoge aleatoriamente la primera pieza o sujeto de la población. A continuación, el investigador seleccionará a cada enésimo sujeto de la lista. El procedimiento del muestreo aleatorio sistemático es muy fácil y se puede hacer manualmente. Los resultados son representativos de la población a menos que se repitan ciertas características de la población por cada enésimo individuo, lo que es muy poco probable.
Ejemplo: N = 1792 estudiantes de psicología. n = 127 Paso 1: Calcular el coeficiente de elevación
N 1792 C.E. 14 n 127 Paso 2: Determinar un número en el rango 1 – 14. Ejemplo: 11 A partir de este número sumar sistemáticamente el valor del C.E.
11 14 25 14 39 1ra unidad muestral
2da unidad muestral
3ra unidad muestral
25
165
305
445
585
725
865
1005 1145 1285 1425 1565 1705
39
179
319
459
599
739
879
1019 1159 1299 1439 1579 1719
53
193
333
473
613
753
893
1033 1173 1313 1453 1593 1733
67
207
347
487
627
767
907
1047 1187 1327 1467 1607 1747
81
221
361
501
641
781
921
1061 1201 1341 1481 1621 1761
95
235
375
515
655
795
935
1075 1215 1355 1495 1635 1775
109
249
389
529
669
809
949
1089 1229 1369 1509 1649
123
263
403
543
683
823
963
1103 1243 1383 1523 1663
137
277
417
557
697
837
977
1117 1257 1397 1537 1677
151
291
431
571
711
851
991
1131 1271 1411 1551 1691
3) Muestreo Estratificado Se utiliza cuando se estudian poblaciones con caracterĂsticas diferentes, que forman estratos, y que por tanto hay que evaluar de forma diferente; para luego los individuos de la muestra sean obtenidos de forma aleatoria dentro de cada estrato. El investigador puede dividir a toda la poblaciĂłn en diferentes subgrupos o estratos. Luego, selecciona aleatoriamente a los sujetos finales de los diferentes estratos en forma proporcional.
El investigador debe utilizar un muestreo probabilístico simple dentro de los diferentes estratos. Los estratos más comunes utilizados en el muestreo aleatorio estratificado son la edad, el género, el nivel socioeconómico, la religión, la nacionalidad y el nivel de estudios alcanzado.
Tipos: Asignación simple: a cada estrato le corresponden el mismo número de unidades muestrales. Por ejemplo, una población dividida en dos estratos en función del sexo, la asignación simple sería: 50% hombres y 50% mujeres. Asignación proporcional: el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato correspondiente con respecto a la población total. Así en un estrato dado, se tiende a tomar una muestra más grande cuando el estrato es más grande Por ejemplo, una población divida en 2 estratos: 60% hombres y 40% mujeres. Si obtenemos una muestra de 10 individuos, la asignación proporcional al tamaño del estrato hará que 6 sean hombres y 4 mujeres. Asignación óptima: se asigna mayor tamaño muestral en el estrato que presenta mayor variablidad interna (varianza) de la característica a estudiar. Es decir, el estrato donde hay más heterogeneidad. Sin embargo, esto supone tener un conocimiento previo de la población estratificada, cosa que raramente sucede.
Ejemplo: N = 1480 estudiantes de nivel secundario n = 136 Curso
Cantidad (NE)
Primero
360
Segundo
275
Tercero
225
Cuarto
190
Quinto
250
Sexto
180
Emplear la fórmula:
N Estrato nTotal E.P. NTotal
Procedimiento y resultados:
360 136 Sub muestra 1ro 33 1480 Curso
Cantidad (NE)
Sub-muestras
Primero
360
33
Segundo
275
25
Tercero
225
21
Cuarto
190
17
Quinto
250
23
Sexto
180
17
1480
136
Total
4) Por Conglomerados En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la poblaciรณn inmediatamente, el investigador realiza varios pasos para reunir su muestra de la poblaciรณn. Los conglomerados pueden ser empresas, instituciones, comunas, ciudades, edificios, OTBs, etc.
El conglomerado más utilizado en la investigación es un conglomerado geográfico. Por ejemplo, un investigador desea estudiar el rendimiento académico de los estudiantes secundarios en la ciudad de Cochabamba.
5) Por Polietapico Muestreo en el que se procede por etapas: se obtiene una muestra de unidades primarias, más amplias que las siguientes; de cada unidad primaria se toman, para una submuestra, unidades secundarias, y así sucesivamente hasta llegar a las unidades últimas o más elementales. Se le puede considerar como una modificación del muestreo por conglomerados cuando no forman parte de la muestra elementos o unidades de todos los conglomerados, sino que, una vez seleccionados estos, se efectúan submuestras dentro de cada uno de ellos.
Muestreo Por Cuotas
La población se divide en grupos o categorías de acuerdo a alguna característica y se toma un número de individuos de cada subgrupo, para completar el tamaño de la muestra. El muestreo por cuotas es una técnica en donde la muestra reunida tiene la misma proporción de individuos que toda la población con respecto al fenómeno enfocado, las características o los rasgos conocidos. Asimismo, el investigador debe asegurarse de que la composición de la muestra final que será utilizada en el estudio cumpla los criterios de cuota de la investigación.
Muestreo Por Conveniencia o Intencional Es de tipo exploratorio, en donde se escogen los sujetos-tipo o informantes-clave que brindan información en profundidad. El informante clave es el que tiene la información, no necesariamente el experto los sujetos son seleccionados dada la conveniente accesibilidad y proximidad de los sujetos para el investigador. Los sujetos de una investigación específica, son seleccionados para el estudio sólo porque son más fáciles de reclutar y el investigador no está considerando las características de inclusión de los sujetos que los hace representativos de toda la población.
Muestreo Secuencial El muestreo secuencial es una tĂŠcnica de muestreo no probabilĂstico en donde el investigador escoge un sujeto o un grupo de sujetos en un determinado intervalo de tiempo, lleva a cabo su estudio, analiza los resultados, luego escoge otro grupo de sujetos, si es necesario, y asĂ sucesivamente.
Muestreo de Bola de Nieve
Llamado también muestreo en cadena, es una técnica de muestreo no probabilístico utilizada por los investigadores para identificar a los sujetos potenciales en estudios en donde los sujetos son difíciles de encontrar. Los investigadores utilizan este método de muestreo si la muestra para el estudio es muy rara o si está limitada a un subgrupo muy pequeño de la población. Este tipo de técnica de muestreo funciona en cadena.
Por ejemplo, para obtener sujetos para un estudio que quiere analizar una enfermedad rara, el investigador puede elegir utilizar el muestreo de bola de nieve, ya que será difícil obtener sujetos. También es posible que los pacientes con la misma enfermedad tengan un grupo de apoyo, y si uno de sus miembros es tu primer sujeto, lo más probable es que allí encuentres más sujetos para el estudio.
Muestreo Por criterios de Inclusión y Exclusión En esta técnica cualitativa de muestreo el investigador establece una serie de criterios tanto para incluir y delimitar la población como para excluir aquellos elementos que no cumplan con los criterios establecidos.
Ejemplo: la población esta constituida por el número total de docentes y alumnos del nivel de educación secundaria, de los colegios del Distrito Educativo Cercado I. Criterios de inclusión: • Docentes del nivel de educación secundaria. • Alumnos matriculados en los años 1° al 5° en el nivel de educación secundaria regular. • Alumnos con asistencia regular al centro educativo. Criterios de exclusión: • Docentes que conducen asignaturas que no necesitan el uso de internet para la realización de trabajos de sus alumnos conforme a los programas de estudio. • Alumnos con más del 30% de inasistencias a la actividad regular del centro educativo. • Alumnos con limitaciones sensorio-perceptivas que les impiden utilizar computadora.
6.3. Ejecutar el proceso de muestreo: Aplicación de las técnicas de investigación según el método de muestreo a utilizar
7. Análisis Estadístico con apoyo de programas digitales Excel SPSS
1.- Técnicas Descriptivas Tablas y gráficos Medidas descriptivas 2.- Técnicas inferenciales de Contraste de hipótesis Chi – cuadrado Correlación lineal T de Student Análisis de correspondencia
Google Drive
Modelo de Contraste de Hipótesis de una cola
Si p es mayor a 0,05 se acepta la Hipótesis Nula Ho: No hay relación entre las variables Ho: No hay diferencias significativas……………….. Si p es menor a 0,05 se rechaza la Hipótesis Nula Hi: Hay relación entre las variables Hi: Hay diferencias significativas……………….