Estadística para Principiantes
SERVICIO NACIONAL DE APRENDIZAJE -SENACORPORACIÓN UNIVERSITARIA CENTRO SUPERIOR SANTIAGO DE CALI
ESTADÍSTICA PARA PRINCIPIANTES Bernardo Angarita De La Cruz Jacinto Azcárate Serrano, PhD. Wilson Eduardo Romero Palacios Saulo Bravo García Deybi Sebastian Salas Tosne
Santiago de Cali - 2015
2
Angarita / Azcárate / Romero / Bravo / Salas
SERVICIO NACIONAL DE APRENDIZAJE - SENADirectora Regional: Dra. Esperanza Adriana Ramos Rodríguez Coordinadora Grupo formación profesional: Dra. Lucila Gutiérrez Carrión CORPORACIÓN UNIVERSITARIA CENTRO SUPERIOR Rector: Augusto Narváez Reyes Vicerrector Académico: Wilson Romero Palacios Secretario General: Edilia Diaz S. Calle 14 Norte No. 8N-35 Barrio Granada Santiago de Cali, Valle del Cauca PBX: (2) 660 1012 Sitio web: www.unicuces.edu.co ESTADÍSTICA PARA PRINCIPIANTES Autores: Carlos Humberto Martínez García Bernardo Angarita De La Cruz Jacinto Azcarate Serrano, PhD. Wilson Eduardo Romero Palacios Saulo Bravo García Deybi Sebastian Salas Tosne Impresión: Litocolor Impreso en Cali, Colombia Depósito Legal: ISBN: 978-958-58853-8-7 © Derechos Reservados © UNICUCES, 2015 Prohibida la reproducción total o parcial del contenido de esta obra por cualquier medio, sin previa autorización.
3
Estadística para Principiantes
INDICE Introducción.............................................................................7 Competencias a desarrollar......................................................9 Generalidades de la Estadística............................................11 ¿Que es la Estadística?..........................................................11 ¿En que se aplica la Estadística?............................................11 Ejemplos de fenómenos observables.....................................11 ¿Por qué es importante el estudio de los fenómenos?...........12 División de la Estadística........................................................12 Estadística descriptiva.............................................................12 Proceso de la Estadística descriptiva........................................13 Inferencia Estadística..............................................................13 Pasos para el estudio en Estadística.........................................14 Conceptos básicos...................................................................16 Actividad No. 1.......................................................................20 Características observables de una población ........................21 Variables cualitativas o categóricas........................................22 Variables cuantitativas............................................................22 Método de recolección de datos.............................................23 Censo......................................................................................23 Encuesta.................................................................................23 Entrevista...............................................................................23 4
Angarita / Azcárate / Romero / Bravo / Salas
Conteo y organización de los datos........................................23 Actividad No. 2......................................................................24 Otros conceptos básicos.........................................................25 Parámetro...............................................................................25 Estadístico..............................................................................25 Tabla de distribución de frecuencias......................................25 Frecuencia Acumulada (FAA)................................................26 Frecuencia Relativa (FR)........................................................27 Actividad No. 3......................................................................28 Actividad No. 4......................................................................31 Desarrollo de competencias....................................................31 Representación gráfica de datos estadísticos.........................33 Gráficas estadísticas................................................................33 Histograma.............................................................................33 Diagrama Circular..................................................................34 Polígono de frecuencias..........................................................35 Diagrama de barras.................................................................36 Actividad No. 5......................................................................37 Actividad No. 6......................................................................38 Medidas de tendencia central, de posición y de dispersión........................................................................40 Medidas de tendencia central.................................................40 Moda......................................................................................40 5
Estadística para Principiantes
Media aritmética o promedio..................................................42 Propiedades de la media aritmética........................................42 Mediana..................................................................................46 Actividad No. 7......................................................................47 Medidas de tendencia central.................................................47 Desarrollo de competencias....................................................49 Medidas de dispersión............................................................53 La variabilidad........................................................................53 El rango (R).............................................................................54 Desviación estándar................................................................55 Desviación media (Dm).........................................................55 Bibliografía consultada...........................................................63
6
Angarita / Azcรกrate / Romero / Bravo / Salas
7
Estadística para Principiantes
INTRODUCCIÓN La estadística es una rama de las matemáticas que nos brinda métodos y técnicas científicas para organizar, analizar e interpretar información, útil para quien tiene que tomar decisiones en una situación de riesgo. Así por ejemplo, las grandes empresas emplean la estadística para tomar sus decisiones de tal forma que sus riesgos sean mínimos o por lo menos predecibles. La estadística no solamente es aplicada por las empresas privadas, también lo hace el Estado para estimar, por ejemplo, la recaudación de los impuestos, o para proyectar la construcción de obras, etc. Su aplicación es muy amplia, sin embargo, su uso requiere de mucho cuidado para no llegar a conclusiones equivocadas. Esta cartilla ofrece algunos conceptos básicos de la estadística, introduciendo al lector al apasionante mundo de los números organizados en forma de datos para resolver problemas, describir comportamientos fenómenos, hechos o situaciones y tomar decisiones frente a situaciones de riesgo en torno a la ejecución de proyectos de todo tipo.
8
Angarita / Azcรกrate / Romero / Bravo / Salas
9
Estadística para Principiantes
COMPETENCIAS A DESARROLLAR ARGUMENTATIVA Es capaz de analizar resultados estadísticos y argumentar las posibles causas producto de los resultados. INTERPRETATIVA Es capaz de interpretar tablas y gráficos estadísticos.
PROPOSITIVA Está en la capacidad de proponer y resolver problemas que involucran conceptos estadísticos.
10
Angarita / Azcรกrate / Romero / Bravo / Salas
11
Estadística para Principiantes
GENERALIDADES DE LA ESTADÍSTICA ¿QUÉ ES LA ESTADÍSTICA? Es la rama de las matemáticas que se ocupa de reunir, organizar y analizar datos de tipo numérico, para ayudar a resolver problemas mediante la toma de decisiones. La estadística como ciencia estudia la forma como debe emplearse la información de tal forma que facilite la toma de decisiones más favorables, cuando hay incertidumbre. ¿EN QUE SE APLICA LA ESTADÍSTICA? Uno de las aplicaciones de la estadística es la de describir el comportamiento de fenómenos observados por el ser humano. Un fenómeno es una manifestación de actividades humanas o de la naturaleza que se pueden percibir o bien a través de los sentidos o mediante la razón. NOTA: La estadística ha sido utilizada desde tiempos inmemorables. Por ejemplo, los babilonios ya la empleaban hacia el año 3000 a. de C. y los egipcios en el siglo XXI a. de C. analizaban los datos de la población y las rentas del país. Ejemplos de fenómenos observables • El comportamiento climático. • Las ventas de una empresa. • Las variaciones en el costo de vida. • El comportamiento de una enfermedad en una población. 12
Angarita / Azcárate / Romero / Bravo / Salas
¿POR QUÉ ES IMPORTANTE EL ESTUDIO DE LOS FENÓMENOS? La estadística genera información sobre el comportamiento de los fenómenos, mediante registros o bien en el tiempo o bien en lugar o en una combinación de ambos. Ello permite tomar decisiones minimizando errores. Cuando se es posible realizar registros de los fenómenos aplicando procesos propios de la estadística, estos se convierten en datos, los datos en información y la información permite la toma de decisiones. El proceso de los datos se logra de diferentes maneras. División de la estadística La estadística, en términos generales, se divide en dos ramas: • Estadística descriptiva. • Inferencia estadística. Estadística descriptiva Describe La estadística descriptiva analiza, estudia y describe a la totalidad del comportamiento de una población ya sea de individuos, fenómenos, cosas o la naturaleza misma. En términos generales, se trata del conocimiento y métodos que se emplean para tratar la recolección, organización y presentación numérica y gráfica de los datos. Los análisis que surgen de este tipo de estadística se limitan únicamente, al conjunto de datos que se recolectaron.
13
Estadística para Principiantes
Proceso de la estadística descriptiva Para el estudio de un fenómeno en una población, en la estadística descriptiva se realizan los siguientes pasos: . Se selecciona los datos relevantes a ser analizados . Se emplea instrumentos de recolección de la información sobre los datos a analizar . Los valores obtenidos se clasifican y ordenan de acuerdo a los componentes que se desean analizar. . Elaboración de tablas (por ejemplo, de frecuencias) según la clasificación que se haga de los datos a analizar . Representación gráfica de los resultados . Obtención de parámetros estadísticos Inferencia Estadística Infiere La estadística inferencial trabaja con muestras o subconjuntos formados por algunos individuos de la población y a partir de estos se hacen inferencias de los aspectos relevantes aplicables a toda la población. La estadística inferencial emplea conocimientos y métodos que permiten: ♣ Generar conclusiones basándose en la información obtenida de una parte del comportamiento del fenómeno aplicándose al total del mismo. ♣ Realizar estimaciones sobre el comportamiento futuro de un fenómeno.
14
Angarita / Azcárate / Romero / Bravo / Salas
Pasos para el estudio en estadística La variabilidad de pasos que se tienen obedece a diferentes circunstancias, tales como: objetivos o al contexto en que se realizan las investigaciones. A manera de ejercicio aquí se propone una serie de pasos que serán de utilidad para comenzar a construir el proceso investigativo desde la estadística. Planeamiento del problema a investigar El planeamiento del problema es lo más importante del proceso. De su correcto planteamiento y el desarrollo de sus componentes depende la calidad de los resultados que se puedan obtener. Componentes
Pregunta de la investigación
Se formula en forma de pregunta. ¿Cuál es el resultado concreto?
Definición de la población Unidad de investigación Pueden ser Naturaleza o clase de los datos
Cuantitativos (se registran con cifras numéricas: 57, 46, etc.) o Cualitativos (Se registran en forma de palabras: estado civil, género, profesión, etc.) 15
Estadística para Principiantes
Se clasifican en: Fuentes de la información
Fuentes primarias: Los obtienen directamente y
datos
se
Fuentes secundarias: Se obtienen a través de otras personas o entidades.
Procedimiento para recolectar los datos
Actividades que se van a realizar para recoger los datos, como: Observación directa, experimentación propia, cuestionarios, entrevistas en grupo o individuales, etc.
Diseño de instrumentos
Son soportes donde se registra la información o los datos: diseñar la encuesta o la entrevista y también la forma e como se va a recoger las respuestas.
Presupuesto
Se debe estimar o calcular cual va a ser la inversión en la investigación.
Recolección Etapa de aplicación de las encuestas o de los datos entrevistas. Es el trabajo de campo. Apreciación del investigador sobre la Crítica y codificación veracidad, la autenticidad y la pertinencia de los datos. Procesos estadísticos mediante los cuales Tabulación, los datos se convierten en tablas, cuadros, gráficas y resúmenes, número y gráficos para describir y medidas comprender el fenómeno o hechos en estudio.
16
Angarita / Azcárate / Romero / Bravo / Salas
Se responde a la pregunta de investigación, se describe el fenómeno o hechos estudiados, se sacan conclusiones, etc. Es donde se concreta la investigación.
Análisis e interpretación
Los análisis pueden tener dos tipos de alcances: Análisis e interpretación descriptivos: Circunscritos solo a los datos recolectados. Análisis e interpretación inferencial: Se extienden a todos los elementos de la población, se hacen estimaciones del comportamiento futuro del fenómeno estudiado.
Conceptos básicos En estadística es fundamental precisar algunos conceptos, puesto que estos pueden tener diferentes significados dentro de su uso cotidiano o en otros contextos. Dato
Registro o anotación del estado de la o las características en un momento determinado de un fenómeno observado. Es la parte individual o componente del todo. Poseen una o varias características de cuyo estado interesa conocerse. El registro del estado de estas características es lo que se conoce como datos.
Elemento Si se desea investigas sobre el comportamiento de las ventas en una empresa, el elemento o elementos pueden ser las facturas (objeto) o los meses (suceso) y la característica observada puede ser el valor de cada factura o sus registros como productos, o también el valor de las ventas por mes. 17
Estadística para Principiantes
Población
No son solo personas, también pueden se cosas o situaciones, eventos, etc. Es el conjunto de elementos del cual se interesa conocer. Presentan una característica en común o hacen parte de una situación en estudio. Si se estudia el resultado de un experimento químico, cada experimento es un elemento o sujeto estadístico y su conjunto es la población.
¿Cómo se define una población? Ejemplo de una construcción que defina la población. Sintaxis: TODAS + DESCRIPCIÓN DEL ELEMENTO + CONDICIÓN RESTRICTIVA. Todas las facturas del año inmediatamente anterior. Todos los trabajadores de la empresa XX Es el número total de elementos o individuos de una población y se suele representar en estadística con la letra N (mayúscula)
Tamaño de la población Si se quiere señalar que una población tiene 800 individuos, se escribe N = 800 Hay dos tipos de población (Finita e infinita).
Tipos de población
Finita, cuando se conoce el número de elementos, es decir su tamaño. Fácilmente se puede contabilizar sus elementos. Ejemplo: La cantidad de estudiantes de un colegio. Infinita, físicamente es imposible enumerar la cantidad de elementos o si se puede, no es conveniente hacerlo por razones económicas o de tiempo.
18
Angarita / Azcárate / Romero / Bravo / Salas
Muestra
Tamaño de la muestra:
Son los elementos o individuos que se extraen de una población. Se observa y registra el estado de una característica que varía en una población, pero sacando solo una muestra. Debe ser representativa de la población, es decir que sus características deben estar representadas en la misma proporción que en la población. Es el número de elementos, individuos, fenómenos o hechos que componen la muestra y se suele representar en estadística con la letra n (minúscula). El tamaño también depende de la precisión que se quiera conseguir en la estimación que se realice a partir de ella para la investigación. Sin embargo, es sorprendente que a partir de una muestra pequeña se pueda llegar a resultados precisos. Ejemplo: el estudio del comportamiento electoral con pocas personas pero donde participan miles de personas.
Proceso mediante el cual se seleccionan los individuos o elementos que harán parte de la muestra. Para obtener resultados confiables Muestreo: y válidos es importante tanto el tamaño de la muestra, como el modo como se selecciona los sujetos que la van a componer.
19
Estadística para Principiantes
Todas las muestras posibles tienen la misma opción o probabilidad de ser elegidas. Muestreo Una técnica para su elección aleatorio es enumerar los elementos simple o unidades muestrales y se sortean hasta completar el número requerido. Se selecciona la muestra de una población según características Muestreo por comunes. Ejemplo, hombres conglomerado solamente, mujeres solamente, profesores, adultos mayores, etc. Técnica de muestreo no probabilístico, los elementos no tienen la misma probabilidad de Clases de ser seleccionados. Se hace por muestreo conveniencia de accesibilidad y proximidad de los sujetos al investigador, porque son más fáciles de reclutar. Útil en las pruebas piloto. Hay varios tipos de muestreo no Muestreo probabilístico: Consecutivo, deliberado por cuotas, discrecional, o por bola de nieve, etc. Son útiles conveniencia: cuando se quiere mostrar que existe un rasgo determinado en la población, en estudios pilotos, cuando es imposible la aleatorización, los resultados no se generalizan, cuando el presupuesto, tiempo y mano de obra es limitado, en estudios iniciales, etc.
20
Angarita / Azcárate / Romero / Bravo / Salas
ACTIVIDAD No. 1 Realizar por parejas la siguiente actividad. • Selecciona un tema que te guste. • Escoge una población. • Mediante uno de los métodos muestrales, selecciona una muestra. • Formula varias preguntas (pueden ser cuatro o cinco). • Aplícalas a la muestra seleccionada. • Con base en la información obtenida saca conclusiones y expóngalas en el resto del grupo. Nota: puede ayudarte del formato en el anexo 1.
21
Estadística para Principiantes
CARACTERÍSTICAS OBSERVABLES DE UNA POBLACIÓN Los elementos de una población se le observan son sus características y de acuerdo con su comportamiento se pueden clasificar en constantes o variables. Son constantes, cuando el valor que presenta la característica en observación no varía o varía muy poco, ejemplo de ello es la variación de estatura de un adulto en los últimos dos años. Son variables, cuando su valor cambia frecuentemente en alguno o todos los elementos de la población o un símbolo que puede tomar diferentes valores dentro de un conjunto determinado. Estas características variables reciben el nombre de variables y pueden ser de dos clases: cualitativas o categóricas y cuantitativas. Describen el estado de las características de los individuos o elementos mediante palabras. Hacen referencia a cualidades, actitudes, preferencias, atributos, Ejemplo: Género (M/F), estado civil (Casado, soltero, viudo), calidad de un producto, etc. Las variables categóricas se pueden subdividir en nominales y ordinales. Variables nominales: No tienen forma particular de organizar sus categorías. Así por ejemplo no tiene un orden para ordenar el género (¿Quién de primero?, el estado civil, los colores, etc. Variables ordinales: Existe una forma común de organizar las categorías. Poseen un orden. Alguien o algo va de primero, de segundo, de tercero, etc., Ejemplo, los grados de estudio en un colegio, nivel de escolaridad de una persona, la calidad de un producto (en bueno, regular o malo), etc.
22
Angarita / Azcárate / Romero / Bravo / Salas
Variables cualitativas o categóricas Variables cuantitativas Se describen por medio de números. Se expresan en cantidades. Los datos suministrados son números. Ejemplo: El peso, la edad, la estatura, etc. Variables Pueden tomar únicamente valores enteros. cuantitativas Ejemplo: número de hijos, número de discretas personas, número de vehículos, etc. Se refieren a mediciones de magnitudes físicas que pueden tomar fraccionarios o Variables decimales. Ejemplo, unidades en dinero, cuantitativas estatura de las personas, altura de objetos, continuas animales, etc. El peso de los paquetes, cantidad de líquido, etc. Facilita el manejo de los datos o la comprensión de los fenómenos; por ello, las variables cuantitativas se pueden convertir Variables en categóricas. Ejemplo, se puede convertir cuantitativas el ingreso económico de las personas en categóricas categorías (menos del mínimo, mínimo, dos salarios mínimos, etc.), la estatura dentro de cierta medida establecida se clasifica en baja, mediana o alta, etc.
23
Estadística para Principiantes
Método de recolección de datos Censo
Encuesta
Entrevista
Conteo y organización de los datos
Se observa y registra una característica variable de una población completa. La muestra es igual a la población. Es un instrumento cuantitativo de investigación social para consultar a un grupo de personas elegidas estadísticamente. Las encuestas pueden ser presenciales, telefónicas o por tecnologías informáticas. Las preguntas pueden ser abiertas, cerradas o mixtas. Es un instrumento cualitativo de investigación social que permite recoger información verbal de un grupo de personas elegidas estadísticamente. Hay entrevistas estructuradas, semi estructuradas o no estructuradas En un estudio estadístico, los datos se organizan preferentemente en tablas en donde se incluyen los valores que toman las variables y se van registrando las respuestas de los encuestados. Las veces que aparece una misma respuesta se conocen como frecuencia absoluta.
24
Angarita / Azcárate / Romero / Bravo / Salas
ACTIVIDAD No. 2 Aplica a 15 personas la siguiente encuesta y regístrala en la tabla de registro. Debe sacar las 15 encuestas para aplicar una a cada persona. El tema tiene que ver con el consumo de bebidas gaseosas. Una vez realizada la encuesta y hecho los análisis preséntalo al grupo (utiliza el anexo No. 2) ENCUESTA No. 1 Tipos de bebidas gaseosas que se consumen con regularidad. Selecciona una sola respuesta: 1. Género a. Masculino ______ b. Femenino ______ 2. ¿Consumes alguna bebida dulce, tipo gaseosa? a. Si ____ b. No ____ (En caso de negativa, pare la encuesta y elija otra persona) 3. ¿Prefiere el tipo de gaseosa dulce o amarga? a. Dulce ____ b. Amarga ____ c. Ambas _____ 4. Tomas bebidas gaseosas a. Pocas veces b. Con alguna frecuencia c. Demasiado frecuente 5. Cuál de las siguientes bebidas le llama más la atención 25
Estadística para Principiantes
a. Bebidas negras ____ b. Bebidas claras _____ c. Bebidas amargas ____ d. Bebidas sin sabor (soda) ____
OTROS CONCEPTOS BÁSICOS
Parámetro
Es un valor constante que resulta de una medida o cálculo, utilizando los datos que se relacionan con el valor que toma una característica variable al observarse todos los elementos o sujetos de una población. Ejemplo de ello es cuando se toma la edad promedio de las personas de una población. En este caso el promedio es un parámetro, la moda o la mediana, son otros parámetros. Son características o indicadores de interés con relación a una población o muestra.
Es una función de la muestra, en tanto que se toman los elementos de la muestra y se procesa para obtener un número que es el estadístico Estadístico que da la información sobre el parámetro de interés. Así por ejemplo la media muestral (x) es un estadístico porque sumamos los valores de los elementos y los dividimos por el número de elementos. El estadístico varía de muestra en muestra. Tabla de dis- Es una tabla que presenta en forma ordenada tribución de los distintos valores de una clase o variable y frecuencias sus frecuencias respectivas. Frecuencia
Es el número de veces que se presenta un valor de manera repetida de la clase o variable. Se obtiene por conteo. 26
Angarita / Azcárate / Romero / Bravo / Salas
3 5 8 3 4 5 2 8 3 6 7 8 2 4 5 8 3 6 2 8 1 6 9 4 8 8 En el ejemplo anterior, el número ocho (8), aparece 7 veces, de modo que la frecuencia es 7 veces. También se conoce como Frecuencia Absoluta (FA).
Frecuencia Acumulada (FAA)
Se van sumando o acumulando las frecuencias absolutas. Se calcula para cada clase o variable dividiendo la frecuencia absoluta de cada clase o variable entre el total de datos de la muestra.
ENCUESTA No. 2 En una encuesta sobre la práctica deportiva se obtuvo los siguientes datos. DEPORTE BEISBOL NATACIÓN FUTBOL PATINAJE CICLISMO BASKETBOL TOTAL
FRECUENCIA ABSOLUTA 8 5 10 12 7 8 50
FRECUENCIA ACUMULADA 8 13 23 35 42 50
27
Estadística para Principiantes
Frecuencia Relativa (FR)
DEPORTE
Es la frecuencia entre la frecuencia absoluta y el número total de datos. Se puede expresar como fracción, decimal o porcentaje. Los valores de las frecuencias relativas generalmente se presentan con dos dígitos decimales y en la suma se tome solamente uno.
FRECUENCIA ABSOLUTA BEISBOL 8 NATACIÓN 5 FUTBOL 10 PATINAJE 12 CICLISMO 7 BASKETBOL 8 50 TOTAL
FRECUENCIA ACUMULADA 8 13 23 35 42 50
FRECUENCIA RELATIVA* 16% 10% 20% 24% 14% 16% 100%
*Resulta de multiplicar la frecuencia absoluta por 100 y dividir por el número total de frecuencias y se escribe en porcentajes.
28
Angarita / Azcárate / Romero / Bravo / Salas
ACTIVIDAD No. 3 • En parejas realiza la siguiente actividad. • Selecciona una muestra de 15 personas. • Aplica el método de muestreo por conglomerados. • Aplique la encuesta No. 3 sobre datos socio económicos de la población. • Una vez aplicada la encuesta enuméralas de 1 a 15. • Con los datos de cada encuesta completa la tabla donde se va a tabular la información. • Completa la tabla de distribución de frecuencias para cada una de las variables de estudio. • Realiza las conclusiones y preséntalas al grupo.
29
Estadística para Principiantes
ENCUESTA No. 3 DATOS SOCIO ECONÓMICOS DE UNA POBLACIÓN Selecciona una sola respuesta: 1. Género a. Masculino ______ b. Femenino ______ 2. Edad a. Entre 15 y 20 años ____ b. Entre 21 y 25 años ____ c. Más de 26 años _____ 3. Ingreso económico por familia a. Excelente ____ b. Bueno ____ c. Regular _____ d. Malo _____ 4. El sostenimiento económico de la familia depende de: a. Padre únicamente____ b. Madre únicamente ____ c. Ambos _____ d. Abuelos Exclusivamente_____ e. Otros _______ 5. Vivo con: a. Ambos padres ______
30
Angarita / Azcárate / Romero / Bravo / Salas
b. Madre únicamente _____ c. Padre únicamente ______ d. Madre y padrastro ______ e. Padre y madrastra ______ f. Abuelos _______ g. Otros _______ 6. Número de Hermanos: h. No tengo ______ i. Entre 1 y 2 _____ j. Entre 3 y 4 ______ k. Más de 5 ______ 7. Las relaciones con mis padres son: a. Excelentes ____ b. Buenas _____ c. Regulares ____ d. Malas ____
31
Estadística para Principiantes
ACTIVIDAD No. 4 Desarrollo de competencias Los alumnos del SENA recogieron datos de los diferentes grupos de formación diurna, sobre actividades culturales y deportivas que se van a organizar. Para ello se realizaron las siguientes encuestas: ¿Qué actividades deportivas quiere que se realicen en el SENA? ¿Qué actividades culturales quiere que se realice? 1. 20 de los 50 encuestados manifestaron señalan que en el SENA debería realizarse “campeonatos de futbol. La frecuencia absoluta es: a. 20
b. 20/50 c. 50/20 d. 1,67%
2. Si de los 50 estudiantes, 15 dijeron que querían “Campeonatos de tenis de mesa”, ¿Cuál es la frecuencia relativa de este dato? 3. Calcule la frecuencia acumulada y la frecuencia relativa en porcentajes de los siguientes datos. DEPORTE
Campeonatos de futbol
FRECUENCIA FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADA RELATIVA*
20
Campeonato de Tenis de mesa Baloncesto
15
Atletismo
6
Juegos de sala
5
4
TOTAL
32
Angarita / Azcárate / Romero / Bravo / Salas
4. Con relación a las actividades culturales, un grupo de personas respondió que los conciertos deberían darse más a menudo, la frecuencia relativa es de 8/50, eso quiere decir: A. 8 personas dieron esa respuesta. B. 50 personas dieron esa respuesta. C. 0,125 personas respondieron. D. 6,25 personas respondieron. 5. A partir de la anterior frecuencia se puede establecer que: a. La cantidad de personas entrevistadas fueron 8. b. 8 personas respondieron la pregunta. c. La cantidad de personas entrevistadas fueron 50. d. Es imposible determinar el número de encuestados. 6. Se encuestó un grupo de una muestra de 30 personas (muestra n), para determinar cuál era el deporte favorito obteniéndose los siguientes resultados DEPORTE
PERSONAS 8 5 7 6 4
Futbol Baloncesto Tenis Basquetbol Ciclismo
33
Estadística para Principiantes
7. Par los datos anteriores elabore la distribución de frecuencias DEPORTE
FRECUENCIA FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADA RELATIVA*
Futbol Baloncesto Tenis Basquetbol Ciclismo TOTAL
REPRESENTACIÓN GRÁFICA DE DATOS ESTADÍSTICOS
Gráficas estadísticas
Histograma
En la estadística descriptiva en términos generales, se emplean varios tipos de gráficos para representar situaciones o fenómenos: El histograma, diagrama de barras, polígono de frecuencias y diagrama de sectores o circular, entre otros. Se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Se parece a los diagramas de barras pero sin espacios. Son gráficos de frecuencias absolutas o de frecuencias relativas. Las representaciones gráficas son en forma de rectángulos.
34
Angarita / Azcárate / Romero / Bravo / Salas
Diagrama Circular
En este tipo de diagramas los datos se reparten en un círculo de 360°, y se reparten proporcionalmente a las frecuencias de los distintos valores de la variable. Resultan útiles cuando se registran datos de tipo cualitativo, o cuando los datos son muy pocos. Existen muchos programas que realizan los gráficos con solo registrar los datos, en los pc, esto lo puede hacer desde Excel. Lo mismo que los demás gráficos.
35
Estadística para Principiantes
Se hace a partir del histograma uniendo las marcas de clase proyectadas sobre el lado superior de los rectángulos. Al unirse los puntos Polígono de medios de la base superior de los rectángulos frecuencias en los histogramas, se obtiene el polígono de frecuencias. Se utiliza principalmente en las muestras distribuidas en intervalos.
36
Angarita / Azcรกrate / Romero / Bravo / Salas
En los diagramas de barras, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. En general se emplean para Diagrama representar variables cuantitativas discretas. En de barras el eje horizontal Equis (X) se colocan los valores de la variable y en el eje vertical ye (Y) se colocan las frecuencias Las barras representan las frecuencias absolutas de los datos.
37
Estad铆stica para Principiantes
ACTIVIDAD No. 5 En una encuesta sobre la preferencia del equipo favorito, los resultados fueron los siguientes: EQUIPO
ENCUESTADO 8 10 7 3 5 2 4 1
Barcelona Real Madrid Manchester Juventus Liverpool River plate Boca Junior Colo colo Realice Tabla de distribuci贸n de frecuencias.
Represente la informaci贸n en los diagramas descritos anteriormente. 38
Angarita / Azcárate / Romero / Bravo / Salas
Tabla de distribución de frecuencias
ACTIVIDAD No. 6 Desarrollo de competencias En una importante empresa se realizó un estudio sobre los programas favoritos. Se encuestó una muestra de 20 empleados. Las preguntas con sus respectivas respuestas fueron las siguientes: 1. ¿Cuántos años tiene? 40 30 27 18 27 19 31 28 30 27 27 36 19 23 27 30 27 40 30 35 2. Futbol, noticias, telenovelas, farándula, futbol, futbol, noticias, dibujos animados, futbol, farándula, noticias, futbol, dibujos animados, farándula, noticias, futbol, novelas, futbol, dibujos animados, noticias, futbol.
39
Estadística para Principiantes
3. ¿En promedio cuantas horas de televisión ve al día? 2 horas, 3 horas, 1 hora, 2 horas, 3 horas, 1 hora, 2 horas, 1 hora, 3 horas, 1 hora, 2 horas, 3 horas, 1 hora, 2 horas, 3 horas, 1 hora, 2 horas, 3 horas, 2 horas, 1 hora. REALICE Tabla de distribución de frecuencias para cada una de las variables. Represente cada variable con un diagrama de barras, con un histograma, con un diagrama circular y con un polígono de frecuencias. Tabla de frecuencias actividad No. 6 EDAD
PROGRAMA
40
Angarita / Azcárate / Romero / Bravo / Salas
HORAS
MEDIDAS DE TENDENCIA CENTRAL, DE POSICIÓN Y DE DISPERSIÓN Son parámetros estadísticos que marcan los valores en torno a los cuales se dispone los datos de una distribución. También se le conocen como medidas de centralización. Medidas de Las más importantes son la moda, la media t e n d e n c i a y la mediana. Reciben este nombre porque al central representar el resultado en un gráfico de una distribución de frecuencias el valor calculado se sitúa por lo general hacia el centro de la gráfica. Moda
Se representa con la forma (Mo). Es el valor que más se repite dentro de los datos de un conjunto. El símbolo que se emplea por lo general es la equis moda (x̂). Cuando los datos no están agrupados, la moda se reconoce a simple vista.
41
EstadĂstica para Principiantes
Ejemplo 27 31 42 36 27 30 27 42 35 27 18 27 35 A simple vista se observa que el 27 es el nĂşmero que mĂĄs se repite, por lo tanto es el valor modal. = 27.
đ?‘ĽĚ‚)
Si ningĂşn dato aparece repetido, entonces no hay valor modal, si por el contrario hay varios valores que se repiten con igual proporciĂłn, entonces todos ellos serĂĄn valores modales Las edades de un grupo de personas de una empresa son las siguientes: 39 42 48 45 39 52 63
60
48 52 39 61 42 44 49
57
64 39 47 52 56 48 57
42
44 50 56 62 41 47 53
55
47 46 42 53 58 51 39 44 39 a 43, de 44 a 48, de 49 a 53, de 54 a 58, de 59 a 63 Construir la tabla de frecuencias y la clase modal, agrupando los datos por intervalos de la siguiente manera: 42
Angarita / Azcárate / Romero / Bravo / Salas INTERVALO FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADA
FRECUENCIA RELATIVA
39 - 43
Se le denomina media aritmética al cociente o resultante en dividir la suma de los datos entre el número de datos. Se le llama Media aritmé- también promedio. Al reemplazar el valor tica o prome- promedio por cada uno de los datos, se obtiene el mismo resultado general. Existen dio dos tipos de media aritmética: la media aritmética simple y la media aritmética ponderada. En la media aritmética simple se dan dos casos: Agrupados y no agrupados. A la media aritmética simple no agrupada se le denomina comúnmente media y se representa con la letra griega μ (mu). xi Representa los valores que toma la variable. Ejemplo, las notas de los estudiantes (4, 3 y 5) .
Propiedades de la media aritmética El cálculo de la media aritmética tiene en cuenta todos los valores de la variable en estudio registrados. 43
Estadística para Principiantes
A todas las variables cuantitativas se les pueden calcular la media aritmética. Un conjunto de datos sólo tiene una media. La media permite hacer comparaciones entre poblaciones o muestras. La media se puede trabajar matemáticamente. La media es afectada por los valores extremos. No se puede calcular la media en distribuciones de frecuencias que tienen clase de extremo abierto.
Un ejemplo Si las edades de 16 personas son: 39 42 48 45 39 52 63
60
48 52 39 61 42 44 49
57
La media será: (39 + 42 + 48 + 45 + 39 + 52 + 63 + 60 + 48 + 52 + 39 + 61 + 42 + 44 + 49 + 57)/16 = 780/16 = 48,75 A partir de una tabla de frecuencias se puede obtener la media, se adiciona una columna a las frecuencias absolutas y allí se calcula el producto de los valores de la variable por los de la frecuencia absoluta, se suman todos los resultados y se divide por el total obtenido en la frecuencia absoluta. Ejemplo Los estudiantes de un importante centro de educación superior obtienen las siguientes notas de un parcial:
44
Angarita / Azcรกrate / Romero / Bravo / Salas
ESTUDIANTE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 45
NOTA 4 3 3 3 4 4 5 5 3 4 5 3 4 5 3 4 3 3 3 4 4 5 5 3 4 5 3 4 5 3
Estadística para Principiantes
Construyamos una tabla de frecuencias a partir de los datos obtenidos NOTAS DE EVALUACIÓN (Xi) 3 4 5 TOTAL (N)
No. DE ESTUDIANTES (FA) 12 10 8 30
En el cuadro anterior se observa que 12 alumnos tienen una nota de 3, 10 alumnos sacaron 4 y 8 alumnos obtuvieron una nota de 5. Como se debe sumar el número de estudiantes por las veces de una nota, podemos entonces multiplicar el número de estudiantes por la nota que sacan. NOTAS DE EVALUACIÓN (Xi)
No. DE ESTUDIANTES (FA)
3 4 5 TOTAL (N)
12 10 8 30
Xi x FA 3 x 12 = 36 4 x 10 = 40 5 x 8 = 40 116
Después de multiplicar Xi x FA, se suman todos los resultados, dando como resultado 116. Este resultado se divide por el total de alumnos 116/30 y el resultado será la media. μ = 116/30
μ = 3,87
Un ejercicio de aplicación En la siguiente gráfica se muestra las edades de un grupo de empleados de una importante empresa. Se quiere conocer la media aritmética de la población.
46
Angarita / Azcárate / Romero / Bravo / Salas
La gráfica siguiente muestra una serie de datos para construir una tabla de frecuencias absolutas y con ello calcular la media aritmética.
Es el valor que se encuentra en el medio de todos los valores de un conjunto de datos ordenados de menor a mayor. Cuando dos valores se encuentran Mediana en el medio, se suman y se dividen por dos, este valor será la mediana. El cálculo de la mediana se hace mediante el uso de la frecuencia acumulada.
Veamos un ejemplo A partir de la siguiente tabla calcular la frecuencia acumulada por intervalo y la mediana. INTERVALO FRECUENCIA ABSOLUTA
39 - 43 44 – 48 49 – 53 54 – 58 59 - 63
FRECUENCIA ACUMULADA
10 11 8 6 5 47
FRECUENCIA RELATIVA
Estadística para Principiantes
Como son 40 datos, se haya el cociente 40/2 = 20 y en la columna de frecuencias acumuladas buscamos el primer valor mayor que o igual a 20. La frecuencia acumulada es 21, el cual corresponde al intervalo 44 – 48, que es donde se encuentra la mediana. Otra forma de conocer la mediana es escribiendo la serie de números en forma ordenada de menor a mayor, ir anulando o tachando uno a la vez de los extremos de la serie y el que quede en el centro es la mediana, pero esto solo en caso de que los números sean impares, porque cuando son pares, los dos que queden se deben promediar. Una desventaja es que solo sirve para datos muy pequeños. Este método es muy sencillo, pero poco útil. Ejemplo 15 15 15 18 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 39
39
ACTIVIDAD No. 7 Medidas de tendencia central En el siguiente cuadro se presenta las ventas registradas en un mes en un almacén de calzado. Domingo
Lunes
Martes
Miércoles
Jueves
Viernes
9
11
10 14 13
10
12
15
10
9
12
10
11
12
15
12
13
10
14
12
10
13
9
11
10
15
13
9
10
12
10
48
Sábado
Angarita / Azcárate / Romero / Bravo / Salas
1. Construye una tabla con frecuencias absolutas, frecuencia acumulada y frecuencia relativa en porcentajes.
2. Identifica la media de tendencia central. 3. Representa la información mediante un polígono de frecuencias, un histograma y un diagrama circular. 4. En la siguiente gráfica de barras se representa la venta de bebidas en una tienda durante un mes.
49
Estadística para Principiantes
a. Calcular las medidas de tendencia central. b. ¿Cuál fue la menor venta y durante cuantos días se presentó? c. ¿Cuál fue la mayor venta y durante cuantos días se presentó? d. Represente la información mediante diagramas de barra y diagramas circulares. DESARROLLO DE COMPETENCIAS 1. De acuerdo con la siguiente tabla sobre el número de ventas realizadas durante una semana, responda a las siguientes preguntas. VALOR FACTURA
No. DE FACTURAS
500.000 – 800.000
12
800.001 – 1.100.000
14
1.100.001 – 1.400.000
13
1.400.001 – 1.700.000
10
1.700.001 – 2.000.000
7
2.000.001 – 2.300.000
6
2.300.001 – 2.600.000
4
a. ¿Cuantas ventas se hicieron? b. Mediante un histograma represente la información anteriormente suministrada.
50
Angarita / Azcárate / Romero / Bravo / Salas
c. Encontrar la Moda, la Media y la Mediana del ejercicio anterior. d. Construya un diagrama de barras, un diagrama circular y un polígono de frecuencias. 2. Según una encuesta realizada los hombres tienden a ocupar una gran parte del tiempo libre viendo televisión, en especial partidos de futbol. En el siguiente diagrama circular se presenta el tiempo en porcentajes del tiempo libre que emplean para ver televisión según rangos de edad.
51
Estadística para Principiantes
a. Represente la información en un polígono de frecuencias. b. Si la encuesta se realizó a 90 personas, ¿Cuál es la frecuencia absoluta? c. ¿Cuál es la media, la moda y la mediana? 3. En un instituto se encuestó a 210 estudiantes sobre la edad y de ello se sacó la siguiente tabla: EDAD 18 19 20 21 23 24 25 26
No. DE ESTUDIANTES 32 22 18 24 26 18 40 30
a. ¿Cuál es la edad entre las personas encuestadas? b. ¿Cuál es el promedio de edad entre las personas encuestadas? 52
Angarita / Azcárate / Romero / Bravo / Salas
4. Los siguientes datos corresponden al número de frutas recogidas durante un mes. 85 72 87 82 90 68 75 78 85 82 71 85 79 82 87 84 78 80 74 72 78 82 85 87 78 76 74 78 82 84 La media de las frutas recogidas es: a. 80
b. 78
c. 82,78
d. 87
5. ¿Cuál es la mediana?
6. ¿Cuál es la moda?
7. Represente mediante una tabla de frecuencias absolutas, lo expresado en el siguiente diagrama de barras.
53
Estadística para Principiantes
8. Si tenemos que la moda de 40 datos es 8, se puede concluir que: a. Los números no pueden ser mayores a 8 b. El número 10 no está en los datos c. No existen números menores que 8 d. El dato que más se repite es el 8
MEDIDAS DE DISPERSIÓN Las medias de tendencia central describen parcialmente la forma como se comporta un conjunto de datos que pertenecen a una muestra o a una población. Su capacidad descriptiva es parcial por lo que se hace necesario complementarla con medidas de dispersión. La variabilidad
Se refiere a qué tan diferentes son entre sí los datos de una muestra o una población, comparándolos con los datos de otras muestras o poblaciones.
También llamadas medidas de variabilidad, muestran la variabilidad de una distribución. Indica la medida en que las puntuaciones de una variable se alejan de la media. Cuanto mayor es el valor, mayor es la variabilidad y cuanto menor sea, más homogénea es la media. De esta forma se conoce si los casos estudiados son parecidos o varían mucho entre ellos. La dispersión hace referencia a qué tan parecidos o diferentes son los datos de una muestra o población comparándolos con un valor que se toma como referencia. Generalmente se toma como de referencia las medidas de tendencia central.
54
Angarita / Azcárate / Romero / Bravo / Salas
Es la más simple de las medidas de dispersión, pero poco usada, también se conoce como Amplitud o recorrido. El rango (R)
La Amplitud o rango de un conjunto de datos es la diferencia entre los datos que tienen el mayor y el menor valor numérico en el mismo.
Ejemplo En un hospital se mide el pulso de dos pacientes. El paciente 1, presenta las siguientes pulsaciones: 77 78
73
El paciente 2, presenta las siguientes pulsaciones: 69 73
90
Para calcular el rango, se toma el valor más grande y se le resta el más pequeño, por lo que queda así: Paciente 1: 78 – 73 = 5 Paciente 2: 90 – 73 = 17 Es la más conocida de todas las medidas de dispersión y su análisis es la base de todos los métodos de estadística inferencial. Hay dos tipos de varianza: Muestral (estadístico) y poblacional (parámetro)
Varianza (σ 2 )
Parámetro 2
=
f=
Estadístico
( (
2
N
1
N
s = 2
N
55
=
1
( x( N
1
2
Estadística para Principiantes
Es la medida de dispersión más útil. La dispersión de un conjunto de datos es pequeña si los valores se agrupan de manera muy cercana a la media y es grande si los valores se dispersan. Esto quiere decir que entre más se aleje de la media la dispersión, menos homogénea son los datos. También es conocida como desviación Desviación típica y es la raíz cuadrad de la varianza estándar Para la población se emplea el símbolo σ y par la muestra el símbolo s. Mientras mayor es la desviación estándar, mayor es la dispersión de la población. Desviación Es la diferencia promedio, en valor absoluto, de media los datos de la muestra o población con respecto (Dm) a su propia media.
56
Angarita / Azcárate / Romero / Bravo / Salas
ANEXO 1 Formato para la presentación de la actividad No. 1 TEMA ELEGIDO: POBLACIÓN ELEGIDA (recuerde emplear la sintaxis) MUESTRA (En cantidades numéricas): TIPO DE MUESTREO PREGUNTAS 1. 2. 3. 4. RESPUESTAS
Pregunta No. 1
Pregunta No. 2
Pregunta No. 3
57
Pregunta No. 4
EstadĂstica para Principiantes
Conclusiones:
58
Angarita / Azcárate / Romero / Bravo / Salas
ANEXO 2 REGISTRO DE LA INFORMACIÓN Pregunta
Conteo
Género Masculino Femenino ¿Consumes alguna bebida dulce, tipo gaseosa? a. Si b. No (En caso de negativa, pare la encuesta y elija otra persona) 3. ¿Prefiere el tipo de gaseosa dulce o amarga? a. Dulce b. Amarga c. Ambas 4. Tomas bebidas gaseosas a. Pocas veces b. Con alguna frecuencia c. Demasiado frecuente 5. Cuál de las siguientes bebidas le llama más la atención a. Bebidas negras b. Bebidas claras c. Bebidas amargas d. Bebidas sin sabor (soda) 1. a. b. 2.
59
Frecuencia Absoluta (FA)
Estadística para Principiantes
Conclusiones
Nota: Cuando se trata de muchas encuestas, este método de registro no es confiable, porque no va a saber qué persona dejó de responder alguna pregunta o cuales respondió. Diligencia además el siguiente formato de registro y comenta las diferencias de ambos formatos de registro con la clase.
60
61
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
No. Encuesta
No
Si
M
F
Consumo bebida
Género
Dulce
Amarga
Ambas
Preferencia de bebida
Pocas veces
Con alguna frecuencia
Demasiado frecuente
Frecuencia de consumo
Negras
Claras
Amargas
Preferencia de bebida
Sin sabor
Angarita / Azcárate / Romero / Bravo / Salas
REGISTRO DE LA INFORMACIÓN
Estadística para Principiantes
TABULACIÓN ENCUESTA No. 3 No. Encuesta
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
62
Angarita / Azcรกrate / Romero / Bravo / Salas
TABLA DE DISTRIBUCIร N DE FRECUENCIAS No. 3
63
Estadística para Principiantes
BIBLIOGRAFÍA CONSULTADA BELTRAN, L. et al (1996) Matemáticas con tecnología aplicada 7°. Editorial Prentice Hall. Colombia CAMARGO, Leonor (2003) alfa 7 con estándares. Serie de matemáticas para educación media y secundaria. Grupo editorial norma. Bogotá. LEVIN, Richard, et al. (2004) Estadística para Administración y Economía. Séptima edición. Pearson education. México. LIND, Douglas; MARCHAL, William y WATHEN, Samuel. (2012) Estadística Aplicada a los Negocios y la Economía Décimo Quinta edición. Editorial McGraw Hill. México. MARTÍNEZ B, Ciro. (2012) Estadística y Muestreo. Décimo Tercera edición. Editorial ECOE. Bogotá.
64
Angarita / Azcรกrate / Romero / Bravo / Salas
65