1. ESTADÍSTICA DESCRIPTIVA INDICE GENERAL DEL CAPÍTULO 1.1. Introducción 1.2 Naturaleza y Fundamentos Estadística 1.2.1. Conceptos Básicos 1.2.2. Método Estadístico 1.2.3. Ejercicios 1.2.3.1. Resueltos 1.2.3.2. Propuestos 1.2.4. Glosario
de
la
1.3. Teoría del Muestreo 1.3.1. Introducción 1.3.2 Tipos de Muestreo 1.3.3. Ejercicios 1.3.3.1. Resueltos 1.3.3.2. Propuestos
1.5. Medidas Descriptivas 1.5.1. Medidas de centralización 1.5.2. Medidas de Dispersión 1.5.3. Medidas de Posición 1.5.4. Medidas de Forma 1.5.5. Ejercicios 1.5.5.1. Resueltos 1.5.5.2. Propuestos 1.6. Análisis Exploratorio de Datos 1.6.1. Diagrama de Puntos 1.6.2. Diagrama Tallo – Hoja 1.6.3. Diagrama Caja – Brazos 1.6.4. Ejercicios 1.6.4.1. Resueltos 1.6.4.2. Propuestos
1.4. Métodos Tabulares y Gráficos 1.4.1. Tabulares 1.3.2. Gráficos
1.1. Introducción 1.2 Naturaleza y Fundamentos de la Estadística 1.2.1. Conceptos Básicos 1.2.2. Método Estadístico 1.2.3. Ejercicios 1.2.3.1. Resueltos 1.2.3.2. Propuestos 1.2.4. Glosario
Vázquez, H. 2009
1
1.1. INTRODUCCIÓN Hace 100 años H.G. Wells comentaba: “Algún día, el pensamiento estadístico será tan necesario para los ciudadanos eficientes como la habilidad para leer y escribir”. Todos los días tenemos a nuestro alcance una amplia diversidad de información que se refiere a la actividad de mercado de valores, las tasa de desempleo, los descubrimientos médicos, los resultados de encuestas de opinión, los pronósticos del clima, la información deportiva, etc. ¿Quién utiliza la estadística? En la última jugada de un partido de Futbol Americano, los Gigantes se encuentran abajo por 4 puntos y tienen el balón en posición de anotar. El coach necesita tomar la decisión de la última jugada; necesitan lanzar un pase o intentarán una corrida. El asistente, consulta su computadora y señala que en las últimas 50 jugadas en situaciones parecidas, 35 veces han corrido con el balón y anotado, por lo que se toma la decisión de que la jugada sea una corrida. El departamento de alimentos y medicina está realizando la prueba final de un nuevo medicamento que cura el cáncer de próstata. El director de de investigación debe decidir si recomienda el medicamento para su uso general, hará la recomendación sólo en el caso de tener la certeza del 99% de que no habrá diferencias significativas entre los efectos secundarios. Existen métodos estadísticos que pueden proporcionarle una buena base para tomar tan importante decisión. El banco de México ha aprendido de la experiencia que existen diversos factores que influyen en gran medida en la determinación de si un cliente pagará a tiempo el préstamo que se le hizo o si se convertirá en moroso. Basado en su información histórica, el banco puede determinar la probabilidad de que un futuro cliente pague el préstamo que se le otorga ó justificar la razón por la que no es posible que se le dé. Por lo anterior, podemos notar que la palabra Estadística significa cosas diferentes para personas diferentes. Cada una de estas personas utiliza la palabra de manera correcta, aunque le den un uso diferente. Todos aquellos recurren a la estadística para auxiliarse en la TOMA DE DECISIONES. La finalidad del presente curso es para ayudar a entender al alumno la importancia de la estadística y la manera de usarla en su vida personal y profesional. La Estadística en los negocios: Prácticamente todos los aspectos de los negocios utilizan estadísticas en la toma de decisiones, por ejemplo: Decisiones Financieras ¿Cómo está la economía? El impacto de la tecnología en el trabajo Estrés en el trabajo Mercadeo y comunicaciones de mercado Índice de precios al consumidor Etc.
Vázquez, H. 2009
2
1.2 Naturaleza y Fundamentos de la Estadística Definición de Estadística: Se define como una ciencia que se encarga de la Recopilación, organización, presentación y análisis e interpretación de un conjunto de datos, que servirán de herramienta para una buena toma de decisiones. La estadística se divide en dos grandes categorías: Si un analista de negocios utiliza los datos que reúne de un grupo para describir o llegar a conclusiones acerca de ese mismo grupo, la estadística se llama Estadística Descriptiva. Pero si un investigador reúne datos de una muestra y utiliza la estadística generada para llegar a conclusiones acerca de la población de la cual se tomó la muestra, la estadística se llama Estadística Inferencial; cuando no estamos absolutamente seguros de la veracidad de tales inferencias, se habla entonces del concepto de Probabilidad. Un investigador puede diseñar experimentos con pequeñas muestras, seleccionadas al azar, y tratar de llegar a conclusiones y hacer inferencias acerca de la población. Los investigadores de mercados utilizan la estadística inferencial para estudiar el impacto de la publicidad en diferentes segmentos del mercado. La ventaja de usar la estadística inferencial es que hace posible que el investigador estudie efectivamente una amplia gama de fenómenos sin tener que llevar a cabo un censo (análisis de toda una población).
1.2.1. Conceptos Básicos Población (ó universo): es la totalidad de elementos sujetos a un estudio, a partir del cual se podrán sacar conclusiones. Muestra: es una porción de la población que es seleccionada para su análisis. Si el objetivo es aplicar la estadística inferencial, la muestra debe ser representativa de la población para que las inferencias obtenidas de ésta, sean aplicables a toda la población, para que sea considerada representativa se debe seguir alguna técnica de muestreo (Capítulo 5). Parámetro: es una medida descriptiva de una población, que por lo general se denotan con letras griegas. Estadístico: es una medida descriptiva de una muestra, que por lo general se denotan con letras romanas. La diferenciación entre los términos parámetro y estadístico es importante sólo con el uso de la estadística inferencial. Un investigador de negocios a veces desea estimar el parámetro, sin embargo, en muchos casos es prácticamente imposible por la dimensión de la población o no es factible debido al tiempo y dinero necesarios para llevar a cabo un censo. En tales casos, el investigador toma una muestra al azar de la población, calcular el estadístico, e inferir por estimación, el valor del parámetro. La base para la estadística inferencial, entonces, es la capacidad de tomar decisiones acerca de los parámetros sin tener un censo completo de la población.
Vázquez, H. 2009
3
El encargado de la toma de decisiones busca evaluar información con el objeto de elegir el curso de acción que rinda el máximo beneficio para los objetivos. A fin de que un análisis estadístico resulte de utilidad en el proceso de la toma de decisiones, los datos de entrada iniciales deben ser apropiados. Si los datos están sesgados, son ambiguos, o tienen otro tipo de error, es probable que aun las pruebas mejor diseñadas no compensen tales deficiencias. Son muchos los métodos que pueden emplearse para obtener los datos necesarios para una investigación: 1. Pueden buscarse datos publicados en diversas fuentes, ya sea gubernamentales, industriales ó particulares. 2. Se puede llevar a cabo un experimento para obtener esos datos. 3. Se puede realizar una encuesta. Para que un estudio resulte útil, los datos recolectados deben ser ´validos, es decir, se deben determinar las respuestas correctas, de manera que las mismas, propicien datos con algún significado. Al estadista le interesa desarrollar un instrumento que le permita manejar diversos fenómenos ó características de una población. A estos fenómenos o características de interés de una población o de una muestra se les denomina VARIABLE, y al valor de la variable asociado a un elemento de una población o una muestra se le llama DATO. Tipos de Datos: Existen básicamente dos tipos de variables que producen dos clases de datos:
DATO CUALITATIVO: es el valor de la variable que indica un atributo ó categoriza.
DATO CUANTITATITVO: es el valor numérico de la variable que cuantifica, cuanta ó mide. o o
DATO CUANTITATIVO DISCRETO: es aquel valor que se obtiene a partir de un conteo, por lo que éstos sólo pueden ser enteros. DATO CUANTITATIVO CONTINUO: es el valor que se obtiene a partir de una medición, por lo que éstos pueden tomar cualquier valor dentro de un intervalo.
Escalas de Medición: Del análisis anterior se desprende que los datos obtenidos pueden también describirse de acuerdo con el “nivel de medición” que se logre. En un sentido más amplio, los datos recopilados se “miden” de alguna manera, por ejemplo, hasta unos datos cuantitativo discreto puede considerarse como producto de un proceso de “medición mediante conteo”. Los cuatro niveles de medición son: Si los datos se obtienen de una variable cualitativa, se miden en:
ESCALA NOMINAL: cuando los datos simplemente se clasifican en distintas categorías que no implican orden.
ESCALA ORDINAL: cuando los datos se clasifican en distintas categorías en las que existe un orden.
Vázquez, H. 2009
4
Si los datos se obtienen de una variable cuantitativa, se miden en:
ESCALA DE INTERVALO: se pueden calcular diferencias entre valores obtenidos de la variable, pero no existe un punto de partida inherente, además los cocientes entre los datos no tienen significado. Por ejemplo, si se analiza la variable temperatura, sus datos podrían ser 45 °C, 90 °C, 180 °C, en donde 90 °C es más caliente pero no es el doble de caliente que 45 °C, además 0°C no indica ausencia de calor.
ESCALA DE RAZÓN: con los datos obtenidos de la variable analizada se pueden realizar todas las operaciones matemáticas (adición, sustracción, multiplicación y división). En esta escala los cocientes entre los datos obtenidos si posee significado, además poseen un cero absoluto. Como ejemplos se citarán los siguientes: Pesos de futbolistas universitarios, Longitud de tornillos, Calificación de alumnos (10 si es el doble de 5).
Observación y Experimento: En un estudio estadístico es necesario diferenciar cuando se realiza una observación de la variable de interés o si se esta realizando un experimento.
OBSERVACIÓN: se refiere a la simple observación de los datos de la variable de interés sin manipular o modificar a los elementos de estudio, por ejemplo si se mide la longitud de los tornillos producidos por una máquina.
EXPERIMENTO: se realiza cuando los elementos de estudio son sometidos a un tratamiento, generando éste un efecto sobre los mismos, por ejemplo, si se mide la longitud de los tornillos producidos por una máquina después de haberle realizado un ajuste, de tal forma que el ajuste (tratamiento) tendrá que generar un efecto en las mediciones de las longitudes de los tornillos, supuestamente se espera que éstas sean mas cercanas al parámetro o especificación buscada.
1.2.2. Método Estadístico Para llevar a cabo un buen estudio estadístico y lograr el objetivo de la estadística que es dar conclusiones sustentadas, es necesario cubrir los siguientes puntos: 1. 2. 3. 4. 5. 6.
Definir en forma clara y precisa la pregunta (problema, objetivo) que se desea responder y la población que está relacionada con esa pregunta. Seleccionar la muestra representativa, proceso que se denomina diseño del experimento o procedimiento de muestreo. Recolección de los datos (experimentos, encuestas, cuestionarios, fuentes de información, etc.) Manejo, descripción y análisis de los datos obtenidos (estudio estadístico descriptivo). Procedimiento para hacer inferencias acerca de la población, basado en la información muestral (estudio estadístico inferencial). La provisión de una medida de confiabilidad o grado de incertidumbre para la inferencia, a través de principios probabilísticos (estudio estadístico inferencial).
Vázquez, H. 2009
5
1.2.3. Ejercicios 1.2.3.1. Ejercicios Resueltos I. Identifica el tipo de variable y su escala de medición siguientes casos:
en cada uno de los
a. El salario de los trabajadores de una empresa b. c. d. e. f.
El número de personas que votan por un partido político La calidad del servicio de una telefonista El recorrido diario de los autobuses de ADO El número de familias que asisten al día a un centro de diversiones Estado civil de un grupo de trabajadores Solución: a. Cuantitativa continua, escala de razón. b. Cuantitativa discreta, escala de razón. c. Cualitativa, escala ordinal. d. Cuantitativa continua, escala de razón. e. Cuantitativa discreta, escala de razón. f. Cualitativa, escala nominal
II. Contesta las preguntas de los siguientes casos prácticos: 1. Se quiere saber el gasto que un estudiante realiza al mes. Uno de los gastos que hace un estudiante es su alimentación y transporte. Se toma una muestra de 30 alumnos para realizar el estudio. Sea "x" el gasto mensual en alimentación y transporte que realiza un estudiante de cierta Universidad. Describa cuidadosamente: a) La población. b) La muestra c) La variable y de que tipo es d) Escala de medición empleada Solución: a) Los gastos en alimentación y transporte de todos los alumnos de la Universidad. b) El grupo de 30 estudiantes que se seleccionó para realizar el estudio c) Gasto mensual en alimentación y trasporte de un estudiante de la universidad, la variable es cuantitativa continua. d) Su escala de medición es de razón.
2. En un estudio realizado a jóvenes de la Cd. De Puebla, se determinó que el 30% del grupo estudiado realiza un deporte fuera de su actividad escolar. Describe: a) La población b) La muestra c) La variable y de que tipo es d) Escala de medición empleada e) Es observación ó experimento f) Es un estadístico ó parámetro Solución: a) Son todos los jóvenes de la Cd. de Puebla. b) Es el grupo de jóvenes que se estudió. c) Actividad que el joven realiza fuera de su actividad escolar, las variables es cualitativa. d) La escala empleada es nominal (si ó no) e) Es observación, porque no se manipula información. f) El 30%..., es un estadístico porque se obtuvo a partir del estudio de una muestra.
Vázquez, H. 2009
6
3. Indica a que escala de medición se refiere cada enunciado: a) Calificación de los alumnos de un grupo de probabilidad b) Clasificación de los empleados de una universidad (administrativos, de servicios, docentes). c) Edades de mujeres que trabajan en el sector productivo. d) La temperatura en °C en los últimos días de cierta ciudad e) Servicio de la cajera de una tienda departamental Solución: a) b) c) d) e)
De razón Nominal De razón De intervalo Ordinal
1.2.3.2. Ejercicios Propuestos 1. Suponga que se obtiene la siguiente información de Juan Domínguez, a su ingreso a la enfermería de la escuela: a) Sexo: Masculino b) Residencia: Santiago c) Clase: 2° año d) Temperatura: 37°C e) Pulso: 70 pulsaciones por minuto f) Presión arterial: 130/80 mgs/mm g) Tipo de sangre: B positiva h) Alergias conocidas a medicamentos: no i) Diagnóstico preliminar: gripe j) Permanencia estimada de reposo: 3 días Clasifique cada una de las diez respuestas de acuerdo con el tipo de datos y con la escala de medición. 2. En una encuesta que realiza Banamex a sus cuenta- habientes, aparecen las siguientes preguntas entre otras: Cuenta con Tarjeta de crédito? Cual es su límite de crédito? Cómo es el trato que recibe del ejecutivo de su sucursal? Cuantos son los movimientos que realiza normalmente en el banco? La intención es realizar el estudio a un grupo de 50 clientes para tomar decisiones en cuanto a la capacitación que debe recibir el personal de las sucursales del estado de Puebla. Responde las siguientes preguntas: a) Describe cada una de las variables consideradas en el estudio y de que tipo son. b) Que escala de medición emplearías en cada una de las variable y porqué? c) Describe la población d) Describe la muestra e) Los resultados obtenidos del estudio serían estadísticos ó parámetros.
Vázquez, H. 2009
7
1.2.4. Glosario Estadística descriptiva: Consiste esencialmente en la recopilación de datos, su organización y presentación ( en forma tabular y/o gráfica ) así como el cálculo de medidas estadísticas representativas con el objeto de poder analizar en forma fácil y rápida al conjunto de datos. Estadística inferencial: Consiste en la interpretación y generalización de los resultados obtenidos del estudio estadístico descriptivo de una muestra para su utilización en la toma de decisiones de una población. Estadística: Conjunto de técnicas para la colección, organización, presentación, manejo, descripción y análisis de información, de manera que las conclusiones obtenidas de ella tengan un grado de confiabilidad especificado. Población: Conjunto de todos los elementos (individuos u objetos) que se están estudiando, acerca de los cuales se intenta sacar conclusiones. Muestra: Es un subconjunto de elementos de una población, que es considerada como representativa de la cual pueden obtenerse importantes inferencias de toda la población. Variable: Característica de interés acerca de cada elemento de una población o una muestra. Dato: Valor de la variable asociado a un elemento de una población o una muestra. Parámetro: Característica que describe a una población. Estadística: Característica que describe a una muestra. Dato cualitativo o atributo: Resultado de un proceso que categoriza o describe un elemento de una población. Dato cuantitativo o numérico: Resultado de un proceso que cuantifica, que cuenta o mide. Datos numéricos discretos: Aquellos que surgen de un conteo. Datos numéricos continuos: Aquellos que surgen de una medición.
Vázquez, H. 2009
8
Observación: Observar y Medir características especificas, sin manipular ni modificar a los sujetos estudiados Experimento: Aplicación de un tratamiento a los sujetos de estudio, observación y medición de su efecto sobre los sujetos Escala de medición nominal: Sólo categorías. Los datos no pueden acomodarse en un esquema de ordenamiento. No existe una relación de magnitud entre las categorías Escala de medición ordinal: Las categorías están ordenadas, pero no es posible determinar diferencias, o éstas carecen de significado. Ordenan los elementos de acuerdo si poseen más, menos o igual cantidad de la variable medida Escala de medición intervalo: Se pueden calcular diferencias entre valores, pero no existe un punto de partida inherente. Los cocientes no tienen significado Escala de medición de razón o proporción: Con un punto de partida inherente. Los cocientes tienen significado
Vázquez, H. 2009
9