Prologo El cuaderno de Estadística y Probabilidad, refleja en forma sencilla y práctico los contenidos básicos de la Estadística General y Probabilidad Estadística. Este trabajo refleja las inquietudes del autor, por presentarles a los estudiantes un instrumento que facilite el proceso de aprendizaje por el área. La Estadística desempeña una ayuda importante para los estudiantes y profesionales que buscan en ella, una herramienta confiable de medición, análisis y estudios de casos y fenómenos que nos interesan. El enfoque que le doy a la Estadística en este cuaderno, va dirigido a los estudiantes y docentes, que andan en busca de una propuesta mas simple y resumida sobre el tema. Se encierra aquí, todos los temas básicos que a mi juicio, necesitan los interesados para avanzar a una estadística más compleja. Atentamente: Prof. Luis Eduardo Camacho Sáez Educación Integral: Mención Matemática. Especialista en Planificación y Evaluación Egresado de UPEL-IUMP T . S . U Administración de Recursos Humanos. Los Teques, Mayo del 2004
Agradecimientos:
Especialmente a: A mi esposa: Yormary por su apoyo constante. A mis hijos: Maria Fernanda y Adri谩n Eduardo por ser la inspiraci贸n de todo mi trabajo. A mis alumnos: por ser la raz贸n pura de mi profesi贸n.
Contenido PARTE I: Definición de Estadística..............................................................................5 Población......................................................................................................5 Muestra.........................................................................................................5 División de la Estadística.............................................................................6 Etapas de la investigación estadística..........................................................6 La estadística en la educación...................................................................7,8 Variables (cualitativas y cuantitativas).....................................................8,9 Unidad estadística.........................................................................................9 Dato estadístico.............................................................................................9 Medición......................................................................................................10 Escalas de medición...............................................................................10,11 Razón, proporción..................................................................................12,13 Porcentaje, porcentaje de cambio...............................................................13 Índices..........................................................................................................13 Sumatorias.............................................................................................14,15 Ejercicios de la parte I...........................................................................16,17 PARTE II: Distribución de frecuencias simple...................................................18,19,20 Distribución de frecuencias para datos agrupados en intervalos…..21,22,23 Histograma de frecuencia...........................................................................24 Polígono de frecuencia...............................................................................24 Polígono de frecuencias acumuladas.........................................................25 Otros tipos de gráficas ( líneas, barras simples y dobles, circular)..........26, .......................................................................................................... 27,28,29 Ejercicios de la parte II....................................................................30,31,32 PARTE III: La media aritmética (simple, para una distribución de frecuencias simples, para datos agrupados en intervalos, ponderada, de varias medias)..........33, ...........................................................................................................34,35,36 La mediana (para datos no agrupados, para datos agrupados en frecuencias simples, para datos agrupados en intervalos)..............................37,38,39,40 Cálculo de la mediana en forma gráfica.....................................................41 La moda (para datos no agrupados, para datos agrupados en frecuencias simples, para datos agrupados en intervalos).......................................41,42 Relación entre las medidas de tendencia central........................................43 Asimetría.....................................................................................................44 Percentiles, cuartiles, deciles.....................................................................45 Cálculo de las medidas de posición para datos no agrupados y para datos agrupados en intervalos..............................................................45,46,47,48
Medidas de dispersión.......................................................................48,49,50 Desviación típica...........................................................................50,51,52,53 La varianza............................................................................................54,55 Ejercicios de la parte III.........................................................56,57,58,59,60 PARTE IV: Correlación positiva, negativa y nula................................................61,62,63 Coeficiente de correlación de Pearson. Interpretación del coeficiente..............................................................................................64,65 Coeficiente de correlación escolar..............................................................65 Confiabilidad. Métodos para calcularla................................................65,66 Método de confiabilidad por mitades..........................................................66 Método de confiabilidad de Kuder Richarson.........................66,67,68,69,70 Ejercicios de la parte IV.........................................................................71,72 PARTE V: Definición de probabilidad...............................................................73,74,75 Experimento aleatorio, espacio muestral....................................................75 Suceso, suceso seguro, suceso imposible, probabilidad condicional.........76 Ejemplos............................................................................................77,78,79 Ejercicios....................................................................................................80 Teorema de la Suma...............................................................................81.82 Teorema de la Multiplicación................................................................83,84 Distribución Binomial.........................................85,86,87,88,89,90,91,92,93 Distribución Normal...................................................................................94 Tabla estandarizada...................................................................................95 Ejemplos de Distribución Normal.....................................................96,97,98 Ejercicios de Distribución Binomial....................................................99,100 Ejercicios de Distribución Normal............................................................101 Bibliografía................................................................................................102
PARTE I: Estadística: Es una ciencia que tiene por objeto tomar una decisión basados en la recopilación, organización, presentación y análisis de datos. La estadística es descriptiva, deductiva (nos lleva a una solución) todo esto es basado en una investigación con el fin de llegar a una conclusión. La parte de la estadística que trata de describir y analizar los datos sin sacar conclusiones se llama estadística descriptiva. La parte de la estadística que trata de dar soluciones y conclusiones para los cuales son válidos, se llama estadística inductiva o inferencial. Población: Es una colección de datos con características especiales (cualidad) de un grupo de individuos o de un grupo de objetos. Ejemplos: 1.- Conjunto de cadetes de la Guardia Nacional. 2.- Número de docentes del Estado Miranda. 3.- Investigación de los sueldos mensuales de los médicos de un hospital. Muestra: Es una parte de la población que se elige con el fin de investigar las propiedades de la población de donde fue extraída. Ejemplos: 1.- Cadetes del 2do año de la Guardia Nacional. 2.- Número de docentes del Municipio Guaicaipuro. 3.- Sueldos mensuales de los médicos de la unidad de pediatría. Elemento Característica Alumno Estatura, sexo, edad, calificaciones. Docente Salario, estado civil. Hogar Gastos.
División de la Estadística: La estadística puede dividirse fundamentalmente en dos partes: Estadística Descriptiva y Estadística Inferencial. Estadística Descriptiva: Esta se ocupa de la recolección, clasificación, ordenación, tabulaciones y representaciones gráficas de los datos estadísticos que se deriven de la medición de las características objeto de estudio. Estadística Inferencial: Esta se propone obtener conclusiones válidas de la población en estudio, a partir del análisis de subconjuntos representativos llamados muestras. Etapas de una Investigación Estadística: En una investigación estadística podemos distinguir seis etapas: 1.- Planificación de la investigación: esta depende del tipo de investigación ya sea descriptiva o explicativa (comprobación de hipótesis). Dentro de la investigación debemos: a.- Formular el problema de investigación. b.- Determinar los objetivos generales y específicos de la investigación. c.- Indagar los antecedentes de la investigación. d.-Establecer la unidad de investigación : se refiere a quien va dirigida la investigación, la cual puede ser un docente, un alumno, una escuela, etc. e.- Determinar si se va a estudiar la población en su totalidad o solo una parte de ella, es decir, una muestra. Si se trabaja con la población el método se llama censo y con una muestra se denomina muestreo. f.- Planificar la elaboración de los censos, encuestas o los test. g.- Elaborar el cuestionario: que consiste en preparar una serie de preguntas o items cuyas respuestas proporcionaran los datos para la investigación. 2.- Recolección de los datos: consiste en distribuir y recoger los cuestionarios y además se debe verificar la calidad de la información obtenida.
3.- Sistematización de los datos: consiste en la presentación de los datos a través de tablas y gráficas estadísticas. 4.- Análisis estadístico: se hallan las medidas de tendencia central, posición, variabilidad, asimetría, relación. Inferencias para la población respectiva, estimaciones y comprobación de hipótesis. 5.- Interpretación de los resultados: consiste en traducir las medidas estadísticas obtenidas y el lenguaje relativo al fenómeno estudiado. 6.- Publicación de los resultados: se dan a conocer los resultados de la investigación a través de un informe. La Estadística en la Educación: Hamdan (1994) afirma que la escuela como elemento clave dentro del sistema educativo, dados sus objetivos y metas, requiere del auxilio de la estadística para cubrir los aspectos: 1.- Recabar, clasificar y analizar los datos que generan el manejo de la matricula escolar con el fin de dar respuestas a las preguntas: .- Características de los alumnos a su ingreso en el sistema escolar: físicas, actitudinales, económicas, etc. .- Características de los docentes: personales, académicas, etc. .- Distribución de los estudiantes dentro del sistema. .- Comportamiento de la deserción, repitencia, prosecución escolar. .- Control del personal administrativos y servicios. 2.- Evaluación escolar: .- Medida de rendimiento estudiantil. .- Análisis de grupo o individualidades. .- Test de aptitudes. .- Prueba de instrumentos de evaluación: confiabilidad y validez. 3.- Investigación del proceso escolar: .- Problemas especiales dentro del sistema escolar. .- Interrelaciones intra-sistemas o Inter-sistemas.
4.- Prospectiva del sistema escolar: predicciones a los distintos niveles. Variables: Cuando se realiza un estudio estadístico de cierto fenómeno, debemos determinar cuales son las características de los elementos que constituyen el objeto de nuestra investigación, estas características deben ser susceptibles de ser definidas o medidas. Tales características reciben el nombre de variables. Las variables se simbolizan con las tres últimas letras del alfabeto: X, Y, Z. Variables Cualitativas (atributos): Son aquellas que no se pueden medir, es decir, no se pueden expresar mediante un número. Los atributos se expresan mediante conceptos (palabras). Ejemplos: Religión: católica, evangélica, judía. Nacionalidad: venezolana, extranjera. Sexo: masculino, femenino. Variables Cuantitativas: Son aquellas que pueden ser medidas y se expresan por una cantidad (numero). Las variables cuantitativas las podemos clasificar en: Variables Discretas y Variables Continuas. Variables Discretas: Son aquellas que admiten únicamente valores numéricos enteros. Ejemplos: .- Numero de alumnos inscritos en la Universidad Católica. .- Cantidad de becas escolares otorgadas por el MECD. .- Números de escuelas católicas que hay en Caracas.
Variables Continuas: Una variable es continua si admite valores fraccionarios. Ejemplos: .- Peso de un alumno. .- Temperatura en Caracas en determinado día. .- Costo en bolívares de la lista escolar. Unidad Estadística: Es el resultado de una observación hecha sobre un fenómeno individual. Ejemplos: .- La calificación de un alumno. .- El sueldo de un docente. Dato Estadístico: Se define como el resultado de la observación de muchas unidades estadísticas. Ejemplos: .- Las calificaciones de un grupo de alumnos. .- Los sueldos de un grupo de docentes. Estadístico: Es una persona que trabaja en la elaboración y análisis de estadísticas. Estadísticas: Son datos agrupados en forma de tablas y gráficas, elaboradas por entidades públicas o privadas y publicadas para el conocimiento del público interesado. Parámetro: Son medidas que describen numéricamente la característica de una población. Ejemplo: La calificación promedio de todos los bachilleres graduados en Los Teques en el año 2002.
Medición: Al elaborar estadísticas con unidades y sus variables, es necesario contarlas, jerarquizarlas y medirlas. Ejemplo: Unidad (alumno)..........variables......... sexo, edad, estatura, calificaciones, cociente intelectual, etc. Forma de medir las Variables: a.- Escala Nominal (categorías): Consiste en aplicar números y otros símbolos para clasificar en categorías las características observadas, las cuales deben ser mutuamente excluyentes y colectivamente exhaustivas, es decir, cada observación debe ser clasificada en una sola categoría y todas las observaciones deben ser clasificadas en alguna de las categorías. Ejemplo: Muestra: Docentes de una escuela....................clasificación por religión Católicos Evangélicos Judíos Otras Ninguna Las categorías de clasificación no están ordenadas de ninguna forma; el hecho de colocar una observación en una categoría particular, simplemente indica que es diferente de otras observaciones hechas en otras categorías y no debe considerarse que sean más o menos importantes que otras observaciones. Ejemplos: .- El número de C.I. .- El color del cabello.
.- Clasificación de los profesionales. .- El origen racial. Con este tipo de escala se pueden hacer algunas operaciones estadísticas: .- Podemos contar cuantos elementos hay en cada una de las categorías formadas y así obtener sus respectivas frecuencias y porcentajes. .- Podemos calcular la categoría que tiene mayor frecuencia, la cual recibe el nombre de Moda. .- Obtener algunas medidas de correlación, como el coeficiente de contingencia. .- Aplicar algunas pruebas de hipótesis como la Ji-Cuadrado. b.- Escala Ordinal (rangos): Puede ser que los elementos de una categoría no solo sean simplemente distintos de las otras categorías, sino que estén en alguna relación con ellos. Los elementos de esta escala se clasifican jerárquicamente por la relación “mayor que” o “menos que”. Ejemplo: .- Resultado de las votaciones: primero, segundo, tercero. .- Velocidad: alta, media, baja. .- Rango militar: soldado, cabo, sargento. La medida estadística de tendencia central más apropiada para esta escala es la Mediana y además podemos usar los métodos estadísticos no paramétricos. c.- Escala de Intervalos: Es aquella que permite que los elementos no solo puedan ser ordenados, sino también asignados a ciertos números, de tal manera que unas diferencias iguales entre los números asignados a esos elementos reflejen diferencias en las cuantías de las características que se han medido. El punto cero de la escala de intervalos es arbitrario y no refleja la ausencia de la característica observada, por tanto no resulta apropiada ni la multiplicación y la división de los números.
Ejemplos: .- La escala de temperatura centígrada. .- La escala de calificaciones. .- Escalas para medir la inteligencia. d.- Escala de Razón: Se diferencia de la escala de intervalos únicamente por poseer un punto cero verdadero, es decir, que el valor cero de esta escala significa ausencia de la característica observada. Ejemplos: .- El ingreso familiar. .- El número de hijos de un grupo de familias. .- El número de alumnos. Razones, Proporciones y Porcentajes: Razón: Es un cociente que indica la relación existente entre dos cantidades, una como numerador con otra como denominador, pero el numerador no debe estar contenido en el denominador; por tanto la razón puede ser un número mayor que la unidad. R= a R = razón b a = dato que posee la característica b = dato que no posee la característica Ejemplo : En una escuela hay 500 alumnos, de los cuales 300 son varones y 200 son hembras. La razón de varones con respecto a las hembras es: R = 300 varones = 3 200 hembras
2
Proporción: Es un cociente que indica la relación existente entre una cantidad y el total de las unidades consideradas. La proporción se calcula mediante la ecuación:
P= a n
a = cantidad n = unidades consideradas
Ejemplo: Se aplicó un test a un grupo de 40 personas, de los cuales 25 son mujeres y 15 son hombres. La proporción de mujeres es: P = 25 = 0,625 40 La proporción de hombres es: P = 15 = 0,375 40 Porcentaje: Son proporciones que se han multiplicado por cien. P % = P . 100 P % = Porcentaje P = Proporción Porcentajes de Cambio: Son los que indican la diferencia existente entre dos cantidades en forma porcentual. Se clasifican en porcentajes de aumento y porcentajes de disminución. Porcentajes de Aumento: Pa = M – m . 100 M= cantidad mayor m m= Cantidad menor Porcentajes de Disminución: Pd = M – m . 100 M= cantidad mayor M m= cantidad menor Índices: La palabra índice se emplea para estudiar una variable en función de otra con la que está relacionada. Dos índices usados en el campo educativo son : El índice de repitencia y el índice de deserción.
Índice de Repitencia: Indica el porcentaje de repitientes en cada curso, especialidad o nivel. Ir = Tr . 100 Tr = total de alumnos repitientes en un año. M M = matrícula inicial del curso en el año. Índice de Deserción: Presenta la proporción del total de desertores y la matrícula inicial del curso, rama o nivel de educación. Id = Td . 100 Td = total de alumnos desertores en un año. M M = matrícula inicial del curso en el año. Sumatoria: La suma de un gran número de términos la podemos indicar mediante la letra griega ∑. Por ejemplo la suma: n
X1 + X2 + X3 + X4 + ..........Xn = ∑ . Xi i=l
n = limite superior de la sumatoria. I = toma valores desde el limite inferior hasta el limite superior. ∑ = sumatoria. I = l limite inferior de la sumatoria. n
∑ . Xi = se lee “suma total de Xi cuando i va desde l hasta n” i=l
Propiedades de la Sumatoria: 1.- La sumatoria de dos o más variables es igual a la suma de las sumatorias de cada una de las variables: ∑ (Xi + Yi ) = ∑Xi + ∑Yi 2.- La sumatoria de una diferencia de dos o más variables es igual a la diferencia de las sumatorias de cada una delas variables : ∑ (X i -Yi ) = ∑Xi -∑Yi
3.- La sumatoria del producto de una constante por una variable es igual al producto de la constante por la sumatoria de la variable: ∑ K .Xi = K . ∑Xi 4.- La sumatoria de una constante K, desde l hasta n, es igual a n veces la constante: n ∑ K=n.K i=l Ejemplos: Dados los siguientes datos: X1= 8 X2 =12 X3 = 4 X4 =6 X5 = 11 X6 = 9 Y1 = 13 Y2 = 7 Y3 = 5 Y4 = 15 Y5 = 1 Y6 = 10 y la constante K = 10. Usando las propiedades de la sumatoria, determinar: 5 1.- ∑ Xi = X2 + X3 + x4 + X5 = 12 + 4 + 6 + 11 = 33 i =2 4 2.- ∑ Yi2 = Y12 + Y22 + Y32 + Y42 = 132 + 72 + 52 + 152 =169+49+25+225=468 i =1
3.-
4 ∑ 15 .Xi = 15 . ( X1 + X2 + X3 + X4) = 15 . (8+12+4+6) = 450 i =1
GUIA DE EJERCICIOS
Una empresa proyecta lanzar al mercado una nueva galleta con sabor a mandarina, y realizan un test de aceptación, usando una escala de 1 a 10 puntos, en una muestra de 80 alumnos. La muestra estuvo compuesta por igual número de alumnos de ambos sexos y con edades comprendidas entre 7 y 12 años de una escuela en Los Teques. a.- ¿Cuál es la población? b.- ¿ Cual es la muestra? c.- ¿Cuál es la variable? d.- ¿ La variable es cuantitativa o cualitativa?
A continuación se dan una serie de ejemplos donde se utiliza variables, Identifica cuales son: atributos, variables discretas o continuas. a.- Marcas de cuadernos ________________________ b.- La velocidad de un automóvil _________________________ c.- Cantidad de pupitres de una escuela _________________________ d.- Peso de un alumno _________________________ e.- Estado civil __________________________ f.- Puntos obtenidos en el lanzamiento de un dado _________________
Si se estudia la población de Venezuela.¿ La estatura promedio de todos los habitantes de Venezuela es un parámetro o un astadígrafo?
Los resultados en una evaluación de Matemática fueron: Aprobados = 12 Aplazados = 10 Inasistentes= 8 Determine: a.- La razón de alumnos aplazados respecto a los alumnos aprobados. b.- La proporción de inasistentes. c.- El porcentaje de aprobados.
PARTE II: Distribución de Frecuencias Simples: Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o categorías y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas la clases y con las frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias.
Pesos X
Frecuencias f 1
46 4
47 48
5
49
3
50 2 51 3
52
2 ∑
n = 20
Frecuencias Acumuladas:
Piramidal
8 7 6 5 4 3 2 1 0
8 7 5 3 1 13
46
79
10 12
Calificaciones
13 15
A L U M N O S
GUIA DE EJERCICIOS:
Un alumno realizó una encuesta a sus profesores y encontró que sus edades eran las siguientes: 32, 28, 32, 28, 40, 32, 21, 30, 32 y 25 años. Elabore una distribución de frecuencias simple.
Las edades de un grupo de niños son: 8, 3,5, 4, 6, 8, 3, 4, 7, 7, 5, 6, 3, 4, 6 ,6,7 y 5 años. Elabore una distribución de frecuencia simple.
Se aplicó una prueba a 12 alumnos y las calificaciones fueron: 12, 10, 14, 17, 12, 9, 10, 16, 17,11, 13 y 15 puntos. Elabore una distribución de frecuencias simple.
Las contribuciones, en Bs. de 30 alumnos para una campaña de limpieza en la escuela, fueron las siguientes:
85 90 75 65 90 115 75 100 80 55 110 75 60 80 90 100 100 80 45 90 120 80 60 5 120 110 75 65 85 60 Elabore una distribución de frecuencias para datos agrupados en 6 intervalos y luego grafica: histograma, polígono y la ojiva.
Los resultados de una evaluación de geografía, aplicada a 30 alumnos fueron:
10 16 8 18 5 17 1 12 16 17 6 5 14 13 19 18 15 11 8 6 10 13 14 12 9 7 15 14 10 17 Elabore una distribución de frecuencias para datos agrupados en 5 intervalos y luego grafica: histograma, polígono y ojiva.
El peso en Kg. de un grupo de 40 estudiantes resultó ser: 52 57 55 57 61 59 55 53 56 58 61 63 54 57 52 64 54 50 58 54 51 60 59 54 52 62 64 50 64 60 62 60 55 60 55 60 58 53 55 62 Elabore una distribución de frecuencias para datos agrupados en 5 intervalos y luego grafique: barras, polígono y ojiva.
GUIA DE EJERCICIOS
Calcule: Q3, D9, P50 y P84 de los datos: 200, 140, 230, 155, 180, 205, 140, 165 140, 190, 180, 225, 240, 140, 140, 155, 165, 140, 140, 140
GUIA DE EJERCICIOS
La media de los diámetros interiores de una muestra de 200 monedas producidas por una máquina es 0,502 pulgadas y la desviación típica 0,005 pulgadas. El propósito para el que se destinan estas monedas permite una tolerancia máxima en el diámetro de 0,496 a 0,508 pulgadas, de otro modo, las monedas se consideran defectuosas. Determinar el porcentaje de monedas defectuosas producido por la máquina, suponiendo que los diámetros se distribuyen normalmente
.