UNIDAD 1. Generalidades de la Estadística 1.1.
Introducción
Las personas vemos la estadística desde perspectivas distintas, suele vérsele como algo relacionado con promedios, porcentajes, cuentas y gráficas; para algunos, la estadística es un área de estudio consistente en reglas y métodos para tratar información; para otros la estadística es una forma de actuar y de pensar con respecto a los sucesos mundanos que ocurren irregularmente y que están gobernados por ciertas leyes de incertidumbre. La Estadística se refiere a un sistema o método usado en la recolección, organización, análisis y descripción de datos numéricos. La Estadística analiza metódicamente los datos, simplificándolos y presentándolos en forma clara; eliminando su confusión inicial; además, permite la elaboración de cuadros, gráficos e índices bien calculados; suficientemente claros, como para disipar las dudas y “oscuridad”. El campo de la estadística descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan deducir de conjuntos de datos. La estadística descriptiva sirve como método para organizar datos y poner de manifiesto sus características esenciales. Por el contrario la estadística inferencial tiene como finalidad obtener conclusiones de una población basándose en los datos de muestra de dicha población. “ Se limita a describir los datos que se analizan, sin hacer inferencias en cuanto a datos no incluidos en la muestra “. 1.1.1. Razones del porqué estudiar estadística. Primera razón. La información cuantitativa se encuentra en todas partes: periódicos, revistas de toda clase (económicas, sociales, farándula, etc.), televisión, radio, anuncios, etc. Mas del 10 % de las personas que utilizaron el nuevo fármaco Adipotide redujeron su peso corporal y, además, siguieron disminuyendo kilos hasta tres semanas despuéses de a nalizar el tratamiento (revista Science Translational Medicine) Nov. de 2011 Despuéses de 48 semanas de estudio, 83 % de los pacientes que tomaron Edurant tuvieron niveles virus del VIH no detectables en la sangre en comparación con el 80 % de los que tomaron Sustiva. Juan Battaglia, jefe de Research del Mercado a Futuro de Rosario (Rofex), dice que el dólar se negociar a a $4; 46 para agosto de 2012, lo que significa una depreciación implícita del 12; 5 %:(La nación.com) Sept. de 2011
Segunda razón. Las técnicas estadísticas se usan para tomar decisiones de la vida diaria, es necesario aprenderlas para analizar conjuntos de datos. (Encontrar relaciones entre variables, determinar si las especificaciones de un producto se están cumpliendo, comparar conjuntos de datos para tomar decisiones, encontrar qué niveles de factores originan los resultados esperados en un proceso, etc.). Ejemplos: Realizar control de calidad de productos, análisis de tiempos de espera de un pedido, de atención en una entidad para realizar mejoramiento, determinar eficacia de productos médicos en términos de tiempo de cura o de número de personas, realizar proyecciones de indicadores económicos u otras variables para que la toma de decisiones presentes se ajusten a las condiciones futuras esperadas; medir variables deseables en un producto para verificación de estándares. Tercera razón Comprender que la estadística es un componente esencial en una educación integral y uno de los pilares fundamentales de la investigación que permiten entender muchos sucesos del día a día y tomar decisiones apropiadas. Para tomar una decisión acertada se necesita: Determinar qué tipo de información se necesita para resolver un problema, si existe esta información, si no existe y debe tomarla, cómo se debe tomar. Organizar, analizar, sacar conclusiones, hacer generalizaciones, etc.
1.1.2. Usos de la estadística Los usos de la estadística son muchos y diversos, se pueden evidenciar desde la generalización o representación numérica de un suceso, hasta la experimentación para la explicación de un fenómeno. Así mismo la aplicación de la estadística comprende todas las áreas de la ciencia, incluyendo las ciencias sociales y de salud. A continuación se presentan usos puntuales: Informar al público Realizar comparaciones Justificar una afirmación Establecer relaciones entre factores (Experimentación) Pronosticar resultados futuros Estimar cantidades desconocidas Quizá una de las razones más importantes para estudiar estadística, sea que nos permite tomar críticamente la información estadística proporcionada por los medios de comunicación, por ejemplo consideremos las siguientes afirmaciones hechas en algunos anuncios de estos medios. Se usará la letra “X” en lugar de una marca comercial: a) La llanta marca X frena un 35% más rápido (¿más rápido que qué?) b) En un periodo de cuatro años, el rendimiento de la gasolina para el coche X aumentó en un 50%. (¿50% de qué?) c) El nuevo jabón es 99,42123% más puro. (¿Puro en qué? ¿respecto a qué?) d) El nuevo calmante X contiene el doble de calmante (¿Eso significa que es dos veces mejor que las otras marcas de calmantes? ¿O que es más eficaz?) e) Ninguna aspirina calma mejor el dolor que la marca X. (Eso quiere decir que no es la mejor, puesto que esta marca puede ser igual de buena que las otras, ¿Es notable la posible confusión cierto?) f) El nuevo Frupiño Naranja Limón es recomendado por mucha de la gente más conocedora (¿conocedora en qué?, ¿sobre cualquier tema? No nos preguntaron…)
Siempre es importante la validación de la información, es decir, saber quién o quienes emiten afirmaciones (conocer su formación, reputación, etc.) y cómo han hecho para llegar a esta (Experimentos, encuestas, entrevistas, observaciones, etc.). El uso de la estadística nos ayuda a no divagar en preguntas sueltas sobre una aseveración, un objetivo es apoyar una afirmación haciendo que ésta sea más verídica. A continuación se mostrarán una serie de ejemplos. a) Algunos estudios hechos recientemente en la universidad Y, sugieren que del 50% de todos los ahogamientos de adolescentes y adultos están asociados con el uso del alcohol. (¿más claro que los anteriores no?) b) Los niños entre los 5 y 10 años que se cepillan los dientes con la pasta dental marca X tienen un 35% menos de caries respecto a los niños con edades en el rango anterior que se cepillan con otras marcas, según un estudio experimental que realizó la multinacional ORAL C, en Haití. (Parece ser confiable la nueva pasta dental, puesto que mencionan la realización de un estudio y quién lo hizo. Es importante saber qué tipo de experimento realizaron, pero eso implicaría el estudio de Diseños y Análisis de Experimentos, que implica los conocimientos tanto de estadística descriptiva e Inferencial). c) Según un estudio hecho por la asociación nacional de educadores de los Estados Unidos de Norte América, 7 de cada 10 estadounidenses no tienen estudios universitarios. (Es clara la información, el ESTUDIO arrojó ese dato: 7 de cada 10, pero quizás la muestra de donde realizaron dicho estudio era muy pequeña y por tanto no resulte tan significativa la información. En todo caso fue correcto decir: “Según un estudio”, para no aseverar sobre toda la Población de Estadounidenses.) Algunas palabras resaltadas en negrita podrán ser familiares para ustedes, pero en el contexto de la estadística es importante saber definirlas.
1.2.
Lenguaje de la Estadística
Es importante comenzar a manejar algunos términos que nos facilitarán la comunicación al momento de trabajar en el campo estadístico, por esta razón se hace necesario conocer: Población: Conjunto de individuos o elementos que son de interés para un estudio, a los cuales se les puede medir una característica u observar un atributo. Muestra: es un subconjunto de la población. Datos: son números o denominaciones que se pueden asignar a un individuo o elemento. Parámetro: Es una medida usada para describir alguna característica de una población. Estadístico: Medida usada para describir alguna característica de una muestra. Estadística descriptiva: Conjunto de técnicas utilizadas para organizar y describir en forma concisa la información recolectada, ya sea mediante tablas, gráficos o a través de unas cuantas medidas descriptivas de manera informativa. Estadística Inferencial: Conjunto de técnicas utilizadas para generalizaciones, predicciones, estimaciones sobre poblaciones a partir de muestras Inducción: Consiste en razonar desde los ejemplos específicos a los casos generales. Deducción: Consiste en razonar desde el caso general hasta los ejemplos específicos Inferencia: Es una generalización obtenida mediante una inducción
Ejemplo POBLACIÓN Y MUESTRA: Un fabricante de balones de fútbol quiere determinar si los consumidores están satisfechos con la hechura de los mismos; con ese propósito localiza a 5.000 de sus 200.000 clientes registrados en sus bases de datos, para realizarle la siguiente pregunta: “¿está satisfecho con la hechura del balón comprado por usted?”. Identificar la población y la muestra para este caso. Solución: La población en la colección hipotética de respuestas de los 200.000 clientes; se dice que es colección “hipotética” porque no se le ha preguntado a toda la población, pero se espera aprender algo mediante la muestra. La muestra constituiría las 5.000 respuestas dadas por los clientes interrogados. Nota: Una población estadística no necesita ser real. Por ejemplo, si un investigador está interesado en los posibles precios de venta de automóviles en 2020, la información deseada NO existe, pero aun cuando no esté disponible los precios de venta de dichos automóviles, junto con la información relativa del índice inflacionario, pueden usarse para predecir los precios finales de los automóviles en 2020.
Ejemplo PARÁMETRO Y ESTADÍSTICO La siguiente situación es quizás muy familiar. ¿Han leído detalladamente la factura de un establecimiento de comidas rápidas? (Uno “legal”). Una propina es la cantidad de dinero que sobre el total del consumo se otorga por un servicio satisfactorio. Durante un mes, a los asistentes de los 5 restaurantes de comidas rápidas “Daniel El Rockero” en Barranquilla, se les dio un cuestionario confidencial preguntándoles cuanta propina habían dejado; los cálculos posteriores demostraron que la propina promedio fue de alrededor de 15% sobre el total del consumo. ¿Es parámetro o estadístico 15%? Solución: Sí solo están en estudio los 5 establecimientos de restaurantes de comidas rápidas “Daniel El Rockero” , entonces la información sobre las propinas de esos establecimientos constituye la población y el 15% del consumo es el parámetro; Sin embargo, si el dato de las propinas de esos 5 restaurantes forman una muestra de una población mayor (“Todos los restaurantes de comidas rápidas de Barranquilla”) de datos de propinas, entonces 15% del consumo es un estadístico. Note que la diferencia radica en el contexto donde se use, puede ser una población o una muestra. Nota: En muchos casos de facturas, aparece detallado un cobro por “servicio voluntario” a lo que formalmente le podríamos llamar propina.
Ejemplo DATO E INFORMACIÓN: Piensen en un lo siguiente: “23 de Junio”. ¿Les resultó familiar?, probablemente no y quizás sea solo una fecha. Ahora bien, piensen en lo siguiente: “31 de Diciembre”, ¿Les resultó familiar?, probablemente sí, puesto que en esa fecha se celebra la llegada del año nuevo. Entonces ¿qué diferencia hay entre la primera fecha y la segunda?, ¿Cuál de ellas consideran que es un dato y cual consideran que es una información?
Nota: De cumplirse o celebrarse alguna fecha especial el 23 de Junio para el lector, se perdería un poco la validez explicativa del ejemplo.
Ejemplo INFERENCIA: Continuemos con parte de la situación anterior. Consideren que están celebrando la llegada del año nuevo, para lo cual es tradición “comer 12 uvas” pidiendo un “deseo” por cada una de ellas. Ahora bien, supongan que hay 100 uvas en un platón, y luego de que usted probara unas cuantas uvas llega a la generalización de que todas las uvas en ese platón están agrias. ¿Qué sucedió? Además de contar con mala suerte al probarlas, está usando un razonamiento inductivo (por probar unas cuantas uvas); la generalización de que todas las uvas del platón están agrias es un ejemplo de inferencia.
“L o s datos se obtienen a través de un proceso llamado medición, el cual asigna una categoría o un valor a una variable, para determinar su unidad de análisis “.
1.3.
Términos claves.
Orden Deducción Inferencia Muestra Estimar
Estadística descriptiva Estadística Inferencial Inducción Población Parámetro