Estadistica Aplicada

Page 1

1


ESTADISTICA APLICADA

ESP. PEDRO PABLO MISNAZA ROSERO

TECNOLOGIA EN DESARROLLO Y BIENESTAR SOCIAL UNIVERSIDAD MARIANA FACULTAD DE HUMANIDADES Y CIENCIAS SOCIALES 2010

2


Hna. Martha Estela Santa Castrillón Rectora

Mag. Luis Alfredo Guerrero Torres Vicerrector Académico

Esp. José Antonio Menza Vallejo Vicerrector Administrativo y Financiero

Mag. Oscar Valverde Riascos Decano Facultad Humanidades y Ciencias Sociales

Prohibida la reproducción total o parcial de esta obra por cualquier medio sin previa autorización

3


CONTENIDO

1. 2. 2.1 2.2 3. 4.

INTRODUCCION UNIDAD I: NOCIONES GENERALES ESTADISTICA DIVISION DE LA ESTADISTICA ESTADISTICA DESCRIPTIVA ESTADISTICA INFERENCIAL CAMPO DE ACCION DE LA ESTADISTICA CONCEPTOS BASICOS

Pรกg. 6 8 8 8 8 8 8 8

UNIDAD II: ORGANIZACION DE LA INFORMACION PRESENTACION 2.1 TABLA O CUADROS 2.2 PARTES ESENCIALES DE UN CUADRO 2.3 CLASES DE CUADROS O TABLAS 2.3.1 CUADRO CRONOLOGICO O HISTORICO 2.3.2 CUADRO O TABLA DE SERIE ESPACIAL 2.3.3 CUADRO CUALITATIVO 2.3.4 CUADRO CUNTITATIVO 2.3.5 CUADRO SIMPLE O SENCILLO 2.3.6 CUADRO COMPUESTO 2.3.7 CUADRO DE CORRELACION 2.4 TABULACION DE LA INFORMACION 2.5 DISTRIBUACION DE FRECUENCIAS 2.5.1 ATRIBUTOS 2.5.2 VARIABLES 2.5.2.1 VARIABLE DISCRETA 2.5.2.2 VARIABLE CONTINUA

12 13 13 14 14 15 15 15 15 16 16 16 17 18 18 18 21

UNIDAD III: GRAFICAS PRESENTACION 3.1 TIPOS DE GRAFICAS 3.1.1 NUMERICAS 3.1.2 LINEALES 3.1.3 DE BARRAS 3.2 HISTOGRAMAS 3.3 CIRCULARES 3.4 DE DISPERSION 3.5 OTROS TIPOS DE GRAFICAS 3.5.1 DE ANILLOS 3.5.1.1 ANILLOS 3.5.1.2 ANILLOS SECCIONADOS 3.5.2 DE BURBUJAS 3.5.2.1 BURBUJAS O BURBUJAS CON EFECTO 3D 3.5.2.2 GRAFICOS RADIALES 3.5.2.2.1 RADIAL Y RADIAL CON MARCADORES 3.5.2.2.2 RADIAL RELLENO 3.6 POLIGONO DE FRECUENCIA

28 28 28 29 29 30 31 32 34 34 34 34 35 35 36 36 36 37

4


3.6.1 3.6.2

POLIGONO DE FRECUENCIA PARA DATOS POLIGONO DE FRECUENCIA ACUMULADA

UNIDAD IV: MEDIDAS DE TENDENCIA CENTRAL INTRODUCCION 4.1 MEDIA ARITMETICA 4.1.1 PROPIEDADES DE LA MEDIA ARITMETICA 4.1.2 OBSERVACIONES SOBRE LA MEDIA ARITMETICA 4.2 MEDIANA 4.2.1 CALCULO DE LA MEDIANA 4.2.2 CALCULO DE LA MEDIANA PARA DATOS VARIABLE CONTINUA 4.3 LA MODA 4.4 MEDIDAS DE POSICION RELATIVA 4.4.1 CUARTILES 4.4.2 DECILES 4.4.3 PERCENTILES

5.1 5.2 5.2.1 5.3 5.3.1. 5.3.2 5.3.3 5.4

6.1 6.2 6.2.1 6.2.2 6.2.3 6.3 6.4 6.5 6.6

37 39 42 43 44 45 47 47 47 50 54 54 54 54

UNIDAD V: MEDIDAS DE DISPERSION INTRODUCCION RANGO O RECORRIDO DESVIACION MEDIA DESVIACION MEDIA PARA DATOS AGRUPADOS VARIANZA VARIANZA PARA DATOS AGRUPADOS PROPIEDADES DE LA VARIANZA OBSERVACIONES SOBRE LA VARIANZA DESVIACION TIPICA O ESTANDAR

57 58 59 59 61 62 63 64 65

UNIDAD VI: INTRODUCCION AL CALCULO DE PROBABILIDADES INTRODUCCION PROBABILIDAD CONCEPTOS FUNDAMENTALES FENOMENO ALEATORIO EXPERIMENTO ESTADISTICO SUCESO O EVENTO ALEATORIO CALCULO DE LA PROBABILIDAD FACTORIAL DE UN NUMERO PERMUTACIONES COMBINACIONES GLOSARIO BIBLIOGRAFIA CIBERGRAFIA

69 69 70 70 70 71 71 74 74 75 78 79 80

5


INTRODUCCION La estadística es una herramienta básica y fundamental para que toda persona sepa usarla no solo al desarrollar una investigación, sino cuando necesite hacer ciertos cálculos que implican el uso de este instrumento como medio de aprendizaje en su quehacer diario cualquiera sea su profesión.

En esta unidad se presentan las generalidades de esta rama de la matemática indicando qué es la estadística, cual es su campo de acción, su división, los conceptos importantes para su manejo teórico- práctico, los conceptos matemáticos más utilizados, los números y las escalas de valores, la relación con la investigación estadística y una introducción la muestreo.

Se busca como propósito inicial que el educando se vaya apropiando de los principales conceptos de esta área de las matemáticas referentes a los términos estadísticos básicos, la finalidad y campo de acción de la estadística, su utilidad dentro de la investigación científica, así como diferenciar las clases de muestreo al abordar este maravilloso campo del conocimiento.

“Cualquier actividad se vuelve creativa Cuando el que la realiza se preocupa por hacerla bien o mejor” J. Updike.

6


NOCIONES GENERALES

7


UNIDAD I: NOCIONES GENERALES

1. ESTADISTICA Es una ciencia que pertenece al as matemáticas, cuyo propósito consiste en brindar elementos que permitan: la recolección, el ordenamiento e interpretación de datos obtenidos en un proceso de investigación científica, de una amanera segura y organizada para obtener posteriormente conclusiones. 2. DIVISISON DE LA ESTADISTICA 2.1 ESTADISTICA DESCRIPTIVA Su función como su nombre lo indica, es describir los datos obtenidos en una investigación con visión de conjunto. El método que se utiliza es el método deductivo, ya que al estudiar globalmente nos permite sacar características particulares. Aquella que se utiliza para reunir, representar y resumir datos, que se presentan organizados en cuadros o tablas acompañados de gráficas. 2.2 ESTADISTICA INFERENCIAL En investigaciones de corte positivista, se requiere ir más allá de la descripción de datos, se necesita tomar decisiones con base a los datos obtenidos y generalizar los resultados que se estudian en un grupo pequeño, desde este punto de vista el método asociado es el inductivo. Aquella que se basa en el cálculo de probabilidades y se utiliza para establecer conclusiones de una población de objetos de estudio, solo analizando una muestra representativa. 3. CAMPO DE ACCION DE LA ESTADISTICA Al llevar a cabo una investigación de tipo cuantitativo, necesariamente se debe recurrir en la mayoría de los casos a la estadística por cuanto le permite obtener mínimo la descripción de un grupo de estudio a nivel educativo, económico, administrativo, en ciencias de la salud, entre otras. 4. CONCEPTOS BASICOS

8


A continuación se enuncian los conceptos básicos utilizados en la estadística, para que usted los analice y estudie detenidamente, al final también encontrará un glosario de términos que se utilizan lo largo del compilado par que recuerde y no se olvide de los términos estadísticos, se apropie de ellos y los utilice en cualquier trabajo o exposición verbal o escrita. POBLACION: Se denomina así a todo el grupo o conjunto de elementos que estudian un proceso de investigación. Desde el punto de vista de la confiabilidad y validez, lo ideal sería trabajar con todo el grupo, aunque en la práctica, esto no resulta adecuado por circunstancias economías, técnicas, etc. MUESTRA: Es un subconjunto obtenido de la población, de tal forma que resulte un grupo representativo. Esto es, que garantice que ese subconjunto conserve las características de grupo total. El proceso de seleccionar de manera adecuada el subgrupo se denomina muestreo y es uno de los principales problemas de la estadística. CARACTERISTICAS GENERALES: Son los rasgos, cualidades o propiedades que tienen los elementos de una población do de una muestra. Cuando se puede medir, se pueden describir numéricamente y reciben el nombre de caracteres cuantitativos o variables. Algunas variables son: estatura, peso, ingresos, valores, ventas, producción, gastos, mortalidad, etc. UNIDAD INVESTIGADA: Son aquellos elementos que integran la población o la muestra que es la fuente de información, puede ser una persona, un grupo, objetos o cosas. Se considera simple cuando se refiere a algo específico, por ejemplo una persona. O se considera compleja cuando se refiere a un conjunto. ESTADISTICO: Es la persona que trabaja en la elaboración y análisis de estadísticas. ESTADISTICAS: Ordenamiento sistemático de datos presentados en cuadros y gráficas consignadas en documentos, publicaciones, archivos, entre otros. ESTADISTICAS PRIMARIAS: Los datos que obtiene el estadístico a través de encuestas directas, utilizando cuestionarios, entrevistas o la observación directa. ESTADISTICAS SECUNDARIAS: Se denomina así a aquellos datos obtenidos por otros investigadores y se encuentran en documentos y publicaciones. PARAMETROS: Las medidas obtenidas para describir numéricamente la característica de una población. Se conoce también con el nombre de valor verdadero. ESTADIGRAFOS: Las medidas obtenidas para describir numéricamente la característica de una muestra. Se conoce con el nombre de estimador puntual.

9


ERROR: Al obtener estadígrafos de diferentes muestras de una población se pueden obtener diferentes resultados. La diferencia entre un parámetro y un estimador se conoce como error. Entre mas pequeño sea este valor, más confiable es el estudio estadístico efectuado.

DESARROLLE LA SIGUIENTE ACTIVIDAD:

Con ejemplos explique en qué casos se utiliza las Estadística Descriptiva y en qué casos la Estadística Inferencial Por qué es útil la Estadística en el campo educativo?

10


ORGANIZACIÓN DE LA INFORMACION

11


UNIDAD II: ORGANIZACION DE LA INFORMACION

INTRODUCCION La presentación organizada de la información obtenida en un proceso investigativo, es una de las partes fundamentales para el posterior análisis y obtención de conclusiones que permitan dar solución al problema de investigación. En esta unidad se presentan algunos criterios para la elaboración de cuadros, tablas o gráficas estadísticas cuyo diseño y presentación estará bajo la creatividad de quien la elabora y su presentación aprovechando los grandes adelantos tecnológicos como el office 2010 que ofrece grandes herramientas de ayuda para una presentación optima y de fácil entendimiento. Con el abordaje de este capítulo, se busca fundamentalmente que el educando adquiera las competencias necesaria para identificar las partes constitutivas de un cuadro o tabla, las reglas para su elaboración, aplicar los conceptos de variables, atributos y frecuencias; la importancia del para qué la presentación bajo la figura gráfica y además como interpretar adecuadamente cuadros y gráficas de las cuales se pueden obtener indicadores que a manea de porcentajes dan mayor claridad a la información que se requiere resaltar.

Cuando alguien sabe ganar, muestra lo que puede. Cuando sabe perdonar, muestra lo que vale. Zorín.

12


2.1 TABLAS O CUADROS

Un cuadro o tabla es un resumen de datos o cifras organizado en filas y en columnas de tal manera que se videncia la relación que existe entre ellos. Una vez se obtiene información a través del proceso de investigación, se hace necesario organizar dicha información con el fin de analizar y sacar conclusiones, una forma de organizar la información es condensándola en cuadros o tablas, para ello es importante determinar si la característica estudiada, es cualitativa o cuantitativa, en el primer caso se denomina ATRIBUTO, y en el segundo VARIABLE, esta variable a su vez puede ser DISCRETA O CONTINUA. La variable es DISCRETA cuando admite únicamente valores enteros, mientras que la variable es CONTINUA si tiene la posibilidad de admitir valores decimales (fraccionarios). Ejemplo. Si se está haciendo un estudio sobre ingreso de un trabajador que oscilen entre $ 250.000 y $ 515.000, dentro de este intervalo cabe la posibilidad de que aparezcan cantidades tale s como $ 280.000,50, $ 514.999.98 etc, que como se observa describen la existencia de cantidades no enteras. En cambio si el determinado grupo se estudia algún gusto o afinidad hacia determinada circunstancia, se pueden obtener subgrupos que al contabilizarlos únicamente nos permite la posibilidad de escoger valores enteros. Es decir, afirmar que la característica A la escogen 20 personas; la característica B, 50 personas; la característica C, 32 personas. 2.2 PARTES ESENCIALES DE UN CUADRO Los siguientes son algunos aspectos consideraos esenciales que todo cuadro debe contener en su presentación. 1. TITULO: Es el enunciado que en forma clara y concisa indica el objeto del cuadro. Generalmente se habla del Q,Q,C que significa Q=quien?, Q=Qué, C= Cuando?. Quien está presentando la información, qué tipo de información y en qué fecha. 2. COLUMNA PRINCIPAL: Corresponde a la columna donde se escriben o colocan las categorías. 3. ENCABEZAMIENTO: Es el registro o el nombre que se le da al inicio de cada columna, indicando el objeto de esta. 4. CUERPO: Es la parte que contiene la información.

13


5. NOTAS EXPLICATIVAS: Su objeto es aclarar operaciones o relaciones que se utilizan en el cuadro o tabla, cuando el cuadro no es original sino tomado de otro informe es necesario aclarar la fuente (libro, revista, documento de dónde se obtiene el cuadro). Ejemplo: analice las partes del cuadro o tabla presentado a continuación.

REPUBLICA DE COLOMBIA DEPRTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA –DANEPrincipales indicadores económicos y financieros de Colombia por año VARIABLE PIB Nacional Deuda Externa Exporta ciones Importa ciones Población Tasa de interés Tasa de Cambio Tasa de Desempleo Salario Mínimo Inflación

2003 3,9

2004 4,9

2005 4,7

2006 6,8

2007 7,5

2008 4,8

2009 3,5

2010 3,1

38.007

39.442

38.455

40.154

44.874

48.752

52.328

55.948

13.782

17.246

21.190

25.181

30.579

34.213

34.011

35.101

13.258

15.878

19.798

24.859

31.172

36.471

39.024

40.195

40.192

40.956

41.734

42.527

43.292

44.071

44.865

45.672

7,8

7,8

7,0

6,3

8,0

8,1

8,2

8,0

2.778

2.390

2.284

2.239

2.015

1.898

2.078

2.299

14,2

13,6

11,8

12,0

11,1

10,2

10,6

11,3

7,8

6,6

7,0

6,3

6,4

6,7

7,0

7,4

6,49

5,50

4,85

4,48

5,69

7,67

6,5

4,0

2.3 CLASES DE CUADROS O TABLAS A continuación se presentan algunas clases de cuadros de los más frecuentemente utilizados, recordando que su diseño puede ser cambiado se acuerdo a conveniencias del investigador. 2.3.1 CUADRO CRONOLOGICO O HISTORICO: (Serie Cronológica). Se utiliza frecuentemente para mostrar los cambios en el tiempo de la característica estudiada (producción, población, agentes climáticos, entre otros). AÑO 2005 2006 2007 2008 2009

NUMERO GRADUADOS 235 256 280 295 340

14


2010

190

2.3.2 CUADRO O TABLA DE SERIE ESPACIAL: Se utiliza para estudiar un fenómeno a través del espacio.

DEPARTAMENTOS VALLE CAUCA NARIÑO CHOCO

NUMERO GRADUADOS 4.500 3.800 3.750 2.300

2.3.3 CUADRO CUALITATIVO: Es aquella serie estadística donde se hace un estudio e un ATRIBUTO que es independiente del tiempo y espacio.

CONCEPTO EXCELENTE MUY BUENO BUENO INSUFICIENTE

NUMERO ESTUDIANTES 80 250 400 30

2.3.4 CUADRO CUANTITATIVO: Es aquella serie estadística donde se estudia una serie característica de la población objeto de estudio que se puede cuantificar, es también independiente del tiempo y del espacio.

ESTATURA (cm) 120 -130 130 -140 140 -150 150 -160 160 -170 170 -180 180 -190

NUMERO ESTUDIANTES 0 3 35 125 80 30 10

Existe otra clasificación teniendo en cuenta su conformación en cuanto a filas y columnas y la función de la variable o variables. 2.3.5 CUADRO SIMPLE O SENCILLO: Aquel que presenta los datos destacando caracteres y frecuencias. RENDIMIENTO EXCELENTE BUENO

FRECUENCIA 25 90

15


INSUFICIENTE TOTAL

15 130

2.3.6 CUADRO COMPUESTO: Aquellos que permiten comparar dos o más variables. RENDIMIENTO EXCELENTE BUENO INSFUICIENTE TOTAL

HOMBRES 15 50 7 72

MUJERES 10 40 8 58

TOTAL 25 90 15 130

% 19,23 69,23 11,54 100

2.3.7 CUADRO DE CORRELACION: Cuando los datos se presentan de tal manera que permite relacionar las variables. EDAD (años) ESTATURA

14 -16

15 -17

18 -20

TOTAL

121 - 130 131 – 140 141 – 150 151 – 160 161 - 170 171 – 180 181 - 190 TOTAL

0 2 5 100 250 80 20 457

1 3 7 300 200 50 10 570

0 2 8 100 300 90 10 510

1 7 20 500 750 200 40 1.537

DESARROLLE LA SIGUIENTE ACTIVIDAD:

Con base en la información suministrada en el anexo del módulo, ponga en práctica todo lo aprendido hasta el momento. Analice la información, identifique sus partes y socialice sus respuestas con sus compañeros y Tutor.

2.4 TABULACION DE LA INFORMACION

16


Una vez se tenga claro qué tipo de serie estadística es laque se está analizando, se procede a la etapa de tabulación de la información que consiste en organizar la información y presentarla en forma resumida y clara. 2.5 DISTRIBUCIONES DE FRECUENCIAS Las tabla o cuadros de frecuencias se utilizan para presentar en forma ordenada los valores que toman las diferentes características, de tal forma que permita a quien lee el informe, tener una visión de conjunto ya sea apara aclarar el texto del informe o con el fin de complementar la información. Con base a lo anterior los datos se clasifican de acuerdo con ciertas características cualitativas y cuantitativas, indicando el número de veces que se repite el atributo o la variable. 2.5.1 ATRIBUTOS Para elaborar una tabla de distribución de frecuencias para un atributo, en primera instancia se procede a tabular el número de repitencia de una determinada característica.

UNIVERSIDAD MARIANA ESTUDIANTES EGRESADOS POR FACULTAD 2009 FACULTAD CONTADURIA PUBLICA

CONTEO /////////////////

FRECUENCIA 17

INGENIERIA

++++++++++

10

EDUCACION

+++++++++++++++++++++++++

25

////////////////////

20

COMUNICACIÓN SOCIAL

Recogiendo la información anterior se puede presentar la información en un cuadro donde se de la posibilidad de analizar la característica mediante el cálculo de razones o tantos por ciento con el fin de posteriormente obtener su representación gráfica. UNIVERSIDAD MARIANA ESTUDIANTES EGRESADOS POR FACULTAD 2009 FACULTAD CONTADURIA PUBLICA

FRECUENCIA 17

% 23,6

INGENIERIA

10

13,9

EDUCACION

25

34,7

17


COMUNICACIÓN SOCIAL TOTAL

20 72

27,8 100

DESARROLLE LA SIGUIENTE ACTIVIDAD:

¿Cómo se obtienen los valores de la columna “tanto por ciento? ¿Cómo se aplica en la elaboración de este cuadro el redondeo de datos? Comente con sus compañeros y Tutor.

2.5.2 VARIABLES Para realizar una distribución de frecuencias para una variable, se debe tener en cuenta en primera instancia si se está trabajando una variable discreta o continua. Una vez se haya determinado esto se procede a efectuar la organización tal como se indica a continuación, pero primero se presenta la simbología que se necesita para elaborar los cuadros. N: n: Xi: Ni: hi:

Ni: Hi: m: Yi:

Representa el número total o tamaño de la población Representa el número total o tamaño de la muestra Característica cuantitativa observada en la unida investigada Frecuencia absoluta que indica número de veces que se repite cada valor de la variable Frecuencia relativa, indica el tanto por ciento correspondiente a la frecuencia absoluta. Se obtiene dividiendo cada valor de la frecuencia absoluta por le tamaño de la muestra o de la población Frecuencia absoluta acumulada Frecuencia relativa acumulada Número de valores que toma la variables, número de marcas de clase o número de intervalos o grupos Variable discreta o marca de clase

2.5.2.1 VARIABLE DISCRETA: La elaboración de una tabla de este tipo se explicará mediante el siguiente ejemplo: si en una institución educativa de 200 estudiantes se está haciendo un estudio sobre número de estudiantes vacunados en los diferentes grados. Debido al poco tiempo que hay para

18


realizar el estudio se tomo la decisión de estudiar el 10% de los alumnos de cada grado. Por lo tanto de acuerdo a la simbología anteriormente enunciada: N = 200 tamaño población n = 20 tamaño de la muestra Xi: (minúscula para la muestra o mayúscula si se trabaja en la población) indica el valor de la característica examinada. En este ejemplo corresponde al número de vacunas por estudiante. Los datos obtenidos para la muestra fueron: X1 = 2 X2 = 3 X3 = 0 X4 = 2

X5 = 2 X6 = 1 X7 = 2 X8 = 1

X9 = 1 X 10 = 3 X 11 = 2 X 12 = 4

X13 = 1 X14 = 0 X15 = 2 X 16 = 4

X17 = 1 X18 = 2 X19 = 2 X20 = 2

Los anteriores datos originales se encuentran desordenados por eso reciben la denominación de datos sin agrupar. Una vez se tiene la anterior información se procede a su organización mediante el proceso de TABULACION, en este proceso se requiere inicialmente determinar los valores que toma la variable. Para ello se puede realizar la tabulación en una tabla que permita realizar el conteo manual. NUMERO DE VACUNAS POR ESTUDIANTE 0 1 2 3 4 TOTAL

TABULACION

NUMERO DEVACUNAS 2 5 9 2 2 20

// ///// ///////// // // -

Resumiendo la anterior información se puede presentar en un cuadro la distribución de frecuencias así: Xi 0 1 2 3 4 TOTAL

ni 2 5 9 2 2 20

hi 10 25 45 10 10 100

Ni 2 7 16 18 20 -

Hi 10 35 80 90 100 -

Explicación del Cuadro

19


Xi: Se utiliza para indicar que se está trabajando con variable discreta, en este caso indica 4 estudiantes que no fueron vacunados hasta aquellos que han sido vacunados 4 veces. Ni: La frecuencia de ocurrencia, en los datos no agrupados se observa que X3 y X14 (los dos) no han sido vacunados, por eso les correspondió al valor X1=0, el numero ni= 2 y así sucesivamente. hi: Representa el tanto por ciento de cada uno de los valores anteriores, se obtiene aplicando la siguiente fórmula:

n

hi = ------ x 100% n Para X1 = 2 se aplicaría así: 9

hi = ------ x 100%

hi = 45%

20 Ni: Es la frecuencia absoluta acumulada, cada dato se obtiene sumando la anterior así: Para Para Para Para Para

X1=0 X2=1 X3=2 X4=3 X5=4

n1=2 n2=5 n3=9 n4=2 n5=2

por tanto por tanto por tanto por tanto por tanto

N1 =2 N2 =2 N3 =2 N4 =2 N5 =2

n1 + n2 = 7 n1 + n2 + n3 = 16 n1 + n2 +n3 + n4 = 18 n1 + n2 + n3 +n4 +n5 = 20

H1: La frecuencia relativa acumulada, se obtiene de manera similar a la frecuencia absoluta acumulada solo que con referencia a hi: Para Para Para Para Para

X1=0 X2=1 X3=2 X4=3 X5=4

h1=10 h2=25 h3=45 h4=10 h5=10

por tanto por tanto por tanto por tanto por tanto

H1 H2 H3 H4 H5

= 10 = 35 = 80 = 90 = 100

En algunos casos conviene hacer la descripción en términos de tantos por ciento (para eso se presenta la columna hi ), o también es útil conocer, el número de observaciones que son mayores o menores que un determinado valor (columnas Ni y Hi ).

20


Par responder la pregunta ¿Cuantos estudiantes han sido vacunados dos veces? Esto implica que no corresponde a un solo valor sino a aquellos estudiantes que han sido vacunados una vez o ninguna. Por tanto en el cuadro se daría respuesta observando Ni, frente a Xi = 2 que corresponde al valor 16 estudiantes han sido vacunados 2 veces (hay 9 que se han vacunado 2 veces; 5 que se han vacunado 1 vez y 2 que no se han hecho vacunar.

DESARROLLE LASIGUIENTE ACTIVIDAD:

1. El coordinador académico de un colegio encontró que el número de días que 20 estudiantes habían tomado incapacidad medica era: 1, 22, 9, 3, 15, 3, 6, 10, 22, 6 7, 16, 4, 15, 25, 5, 9, 10, 3, 6 Tomando como variable días (enteros) elabore una tabla de frecuencias discretas. 2. En la tabla anterior identifique X 4, X8, X12, n3, n11, N 2, N 10,h10, H8, H12 Compares sus respuestas con sus compañeros y haga entrega a su Tutor.

2.5.2.2 VARIABLE CONTINUA: Cuando la variable es continua se organiza la información por grupos, intervalos o clases que nos permiten comprender que determinada característica está en esa clase. Par poder escoger eso intervalos o clases adecuadamente se debe considerar lo siguiente: -

En un conjunto de datos, existe un máximo valor y un valor mínimo, donde los demás datos están distribuidos entre ellos. La diferencia ente el mayor de los datos y el menor de ellos se denomina RANGO O RECORRIDO.

-

Debe existir un determinado número de intervalos de clase m. No existen normas definidas respecto al número de clases o intervalos que se pueden utilizar en una distribución de frecuencias. Si el número de

21


clases es muy pequeño se corre el riesgo de perder detalles; y si son muchas, casi no se puede apreciar con claridad el patrón de comportamiento, aparte de lo dispendioso del trabajo. Se han establecido algunos criterios para la determinación de este número, se aconseja no menos de 5 ni más de 18 intervalos de clases. Estos intervalos debe ser iguales, salvo que algunas circunstancias hagan forzoso el utilizar intervalos de diferente anchura, o utilizar intervalos abiertos (sin límite). Para escoger el valor m ó número de intervalos de clase se pueden escoger entre otras de las siguientes formas: 1. Aplicando la regla de Sturges m = 1 +3,3 log N si se trabaja con el tamaño N de la población ó m = 1 +3,3 log n sise trabaja con el tamaño n de la muestra. 2. De acuerdo a la experiencia de la persona se elabora el cuadro, se puede elegir al tanteo el número adecuado de clases. Con base a lo analizado anteriormente y mediante un ejemplo se realizará un cuadro de distribución de frecuencias para variable continua: Si se está haciendo un estudio sobre las estaturas de un determinado grupo de estudiantes y se selecciona una muestra de 30 con los siguientes datos: X1=1,25 X2=1,30 X3=1,60 X4=1,35 X5=1,30

X6=1,59 X7=1,29 X8=1,38 X9=1,30 X10=1,42

X11=1,45 X12=1,31 X13=1,46 X14=1,48 X15=1,50

X16=1,53 X17=1,52 X18=1,32 X19=1,29 X20=1,59

X21=1,20 X22=1,32 X23=1,59 X24=1,60 X25=1,30

X26=1,32 X27=1,34 X28=1,44 X29=1,35 X30=1,48

El anterior grupo es conveniente ordenarlo en forma ascendente.

Xi

TABULACION

ni

1,20 1,25 1,29 1,30 1,31 1,32 1,34 1,35 1,38 1,42 1,44 1,45 1,46 1,48 1,50 1,52

// / // /// / /// / // / / / / / // / /

2 1 2 3 1 3 1 2 1 1 1 1 1 2 1 1

22


1,53 1,59 1,60 TOTAL

/ /// // -

1 3 2 30

Hasta aquí se ha obtenido un conjunto ordenado de datos no agrupados. Ahora procedemos a agruparlos. Para hacerlo se puede tener en cuenta los siguientes pasos: 1. Encontrar el rango R o sea la diferencia entre el mayor de los datos y el menor de los datos R = 1,60 -1,20 R = 0,40 2. Seleccionar un número apropiado de intervalos de clase. Si lo hace tentativamente, es necesario recordar que los analistas aconsejan escoger entre 5 y 18 intervalos. En este caso lo vamos a hacer aplicando la regla de Sturges: m = 1+ 3,3 log n donde m es el número que indica el número de clases adecuadas para la muestra n = 30 m = 1+3,3 log 30 m = 1+3,3 (1,4771217) m = 1+4,8745001 m = 5,8745001 m=6

(log 30 se obtiene en una calculadora científica)

aproximando al entero más próximo

2. Con el anterior valor se selecciona el ancho del intervalo: Rango Ancho Intervalo = -----------------------Número Clases 0,40 AI = ---------6 AI = 0,06666666

AI = 0,07

R AI = -----m

Aproximando

Con este dato escogemos el nuevo rango R = (A I) m Reemplazando R = (0,07) (6) R = 0,42 El exceso 0,02 entre el primer rango y el segundo se distribuye entre el menor de los datos llamado también límite inferior y el mayor denominado límite superior, en este caso agregamos 0,01 al límite superior y quitamos 0,01 al límite inferior 1,20.

23


Para seleccionar el número de clases no pueden darse reglas invariables, este número se selecciona teniendo en cuenta dive rsos factores que afectan el estudio, tales como rango, variabilidad de los datos, cantidad de datos y sobre todo la finalidad del estudio estadístico. El número de intervalos de clase obtenido a veces toca cambiarlo cuando se obtiene que en un determinado intervalo la frecuencia de ocurrencia es cero. A este proceso se le denomina reajuste de intervalos que consiste en ampliar o disminuir el ancho de la clase. 3. Se forman los intervalos partiendo el límite inferior acomodado de acuerdo al nuevo rango y se le va sumando la cantidad AI. Para el ejemplo, se empieza desde: 1,19 – 1,25 1,26 -- 1,32 1,33 -- 1,39 1,40 – 1,46 1,47 – 1,53 1,54 – 1,60 Al límite inferior 1,19 le sumamos el ancho del intervalo AI para obtener el segundo límite inferior 1,26; a éste le sumamos otra vez esa cantidad para obtener el tercer límite inferior 1,33 y así sucesivamente hasta obtener 6 límites inferiores. El límite superior se forma quitando a este caso una centésima Una vez determinado los limites inferiores y superiores de cada inérvalo de clase y teniendo en cuenta que esta agrupación se considera adecuada siempre y cuando todos y cada uno de los datos o características estén dentro de cada inérvalo o clase. Con base a lo anterior se puede construir el siguiente caso de distribución de frecuencias de variable continua: CLASES O INTERVALOS 1,19 – 1,25

Ni

3

3

10

10

1,22

30

100

1,26 – 1,32

9

12

30

40

1,29

27

90

1,33 - 1,39

4

16

13,3

53,3

1,36

18

60

1,40 – 1,46

4

20

13,3

66,6

1,43

14

46,7

1,47 – 1,53

5

25

16,7

83,3

1,50

10

33,4

1.54 – 1,60

5

30

16,7

100

1,57

5

26,7

TOTAL

30

-

100

-

-

-

-

ni

Hi

hi

Yi

Ni

Hi

Explicación del cuadro o tabla de distribución de frecuencias: La columna ni, representa el número de datos comprendidos entre el límite inferior 1,19 y el límite superior 1,25. Este valor se selecciona apoyándose en el cuadro

24


ordenado de datos no agrupados. Están 1,20 (2 veces) y 1,25 (1 vez) y así sucesivamente para cada clase. La suma total debe ser la de la muestra. Ni corresponde a la frecuencia absoluta acumulada, se obtiene sumando intervalo a intervalo los valores ni. La columna hi representa el tanto por ciento correspondiente a cada ni. Se obtiene con la formula Ni= ( hi/N) x 100% si se trata de una población o Ni= (hi/ n) x 100% si se trata de una muestra. La columna Hi se obtiene de manera similar a Ni, solo que se toma como base los valores hi . Yi se denomina MARCA DE CLASE, como ya no está tomando un solo dato sino un conjunto, es necesario tomar un valor que represente a cada intervalo, este punto es el punto medio de cada clase o intervalo y se calcula así: Yi = Limitesuperiorintervalo – Limiteinferior intervalo 2

Para obtener:

Y1 =

1,25 -1,19 = 1,22 2

Para obtener:

Y2 =

1,32 -1,26 = 1,29 2

y así sucesivamente.

Ni * se llama frecuencia acumulada absoluta descendente. Se toma el valor total y se lo va restando el correspondiente ni. Para obtener

N2* = N1* - n1 N2* = 30 – 3 N2* = 27

Para obtener

N3* = N2* - n2 N3* = 27 – 9 N3* = 18

Esta columna se utiliza cuando se quiere saber por ejemplo cuantos datos se encuentran por encima de determinado valor. Hi* se denomina frecuencia acumulada relativa descendente y se obtiene de forma similar a Ni* tomando como base a hi .

DESARROLLE LA SIGUIENTE ACTIVIDAD:

1. Un profesor desea investigar algunas características de los estudiantes a su cargo. Al medir las estaturas de 20 de ellos encontró los siguientes datos: 155, 155, 150, 150, 150, 145, 145, 140, 140, 145 150, 145, 155, 165, 165, 160, 160, 160, 142, 142 Elabore una tabla de frecuencias para esta variable continua, compárela

25


2. Complete el siguiente cuadro:

CLASES

Yi

Ni

ni

160 -164

1

165 – 169

6

170 – 174

8

175 – 179

20

180 – 184

7

185 – 189

5

190 - 193

3

hi

Hi

3. Con el siguiente ejercicio, realice todos los pasos vistos hasta el momento. Compare sus respuestas con la de su Tutor. 48 97 80 45 91

46 85 83 95 92

48 82 96 50 76

45 72 48 93 98

93 53 86 85 82

75 47 60 46 59

64 72 72 57 68

75 50 48 45 85

4. DEFINA LOS SIGUIENTES CONCEPTOS:  Frecuencia  Intervalo de Clase  Fuente Primaria  Tabulación  5. El Jefe de Ventas de almacenes Éxito de Pasto, investiga el precio de un cierto artículo en 40 almacenes diferentes y encuentra los siguientes datos: 83, 75, 77, 68, 77, 63, 86, 72, 68, 88, 80, 89, 84, 70, 91, 73, 87, 75, 71, 75, 72, 85, 68, 70, 60, 89, 75, 73, 76, 65, 72, 83, 74, 88, 67, 71, 76, 74, 79, 75 Se pide elaborar una distribución de frecuencias de datos agrupados con ancho conveniente y ajustes necesarios, si fuere el caso, identificando: IAC, IRC, F, F.A., %F.R., %F.R.A, Xj.

26


GRAFICAS

27


UNIDAD III. GRAFICAS

INTRODUCCION Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que guardan entre sí. También puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. La representación gráfica permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental). Entre las distintas funciones que cumplen la s graficas están: Hacen más visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolución histórica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlación entre dos o más variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las tablas y las exposiciones teóricas o cuantitativas. El estudio de su disposición y de las relaciones que muestran pueden sugerir hipótesis nuevas.

3.1 TIPOS DE GRAFICAS Existen diferentes tipos de gráficas, que se pueden clasificar en: 3.1.1 NUMERICAS: con imágenes visuales que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población.

28


3.1.2 LINEALES: se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan para varias muestras en un diagrama.

3.1.3 DE BARRAS: Se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando

29


una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.

30


3.2 HISTOGRAMAS: Se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los límites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.

3.3 CIRCULARES: gráficas que nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.

31


3.4 DE DISPERSION: Es un diagrama que representa gráficamente, en un espacio de ordenadas, los puntos de dicho espacio que corresponden a los valores correlativos de una distribución conjunta, estos diagramas deben usarse cuando tenemos un análisis estadístico bivariable, ósea una tabla de datos de doble entrada, la ventaja que tienen es que se puede graficar de una forma sencilla una distribución bivariante conjunta y la desventaja principal es que no funciona si sucede que una dupla se repita. Ejemplo: Se tiene la siguiente tabla, representarla gráficamente en un diagrama de Dispersión:

32


X

Y

A

2

3

B

4

1

C

5

4

D

3

6

E

2

8

DESARROLLE LA SIGUIENTE ACTIVIDAD:

Con base en el siguiente cuadro realice las graficas de: a) Histograma de Frecuencia Absoluta b) Histograma de Frecuencia Relativa

33


CLASES 46,1 – 54 54,1 – 62 62,1 – 70 70,1 – 78 78,1 - 86

Ni 2 4 10 5 1

Yi 50,05 58,05 66,05 74,05 82,05

22

Ni 2 6 16 21 22

hi 9,09 18,08 45,45 22,73 4,55

Hi 9,09 27,27 72,72 95,45 100

100

3.5 OTROS TIPOS DE GRAFICAS 3.5.1 DE ANILLOS: En un gráfico de anillos se pueden representar datos organizados únicamente en columnas o en filas de una hoja de cálculo. Al igual que un gráfico circular, un gráfico de anillos muestra la relación de las partes con un todo pero puede contener más de una serie de datos (serie de datos: puntos de datos relacionados que se trazan en un gráfico. Cada serie de datos de un gráfico tiene una trama o color exclusivo y se representa en la leyenda del gráfico. Puede trazar una o más series de datos en un gráfico. Los gráficos circulares sólo tienen una serie de datos.).

NOTA Los gráficos de anillos no son fáciles de leer. Puede que desee utilizar un gráfico de columnas apiladas o un gráfico de barras apiladas en su lugar. Los gráficos de anillos tienen los siguientes subtipos de gráfico: 3.5.1.1 Anillos Los gráficos de anillos muestran los datos en anillos, donde cada anillo representa una serie de datos. Si se muestran porcentajes en etiquetas de datos, cada anillo totalizará el 100%.

34


3.5.1.2 Anillos seccionados De manera muy similar a los gráficos circulares seccionados, los gráficos de anillos seccionados muestran la contribución de cada valor a un total mientras se destacan los valores individuales, pero pueden contener más de una serie de datos.

3.5.2 DE BURBUJAS: En un gráfico de burbujas, se pueden trazar los datos que se organizan en columnas en una hoja de cálculo de manera que los valores x se muestran en la primera columna y los valores y correspondientes y los valores de tamaño de burbuja se muestran en columnas adyacentes. Ejemplo, organizaría los datos como se muestra en el siguiente ejemplo.

35


Los gráficos de burbujas tienen los siguientes subtipos de gráfico: 3.5.2.1 Burbujas o burbujas con efecto 3D Ambos tipos de gráficos de burbujas comparan conjuntos de tres valores en lugar de dos. El tercer valor determina el tamaño del marcador de burbuja. Puede elegir mostrar las burbujas en formato 2D o con un efecto 3D.

3.5.2.2 Gráficos radiales Los datos organizados en columnas o filas en una hoja de cálculo se pueden representar en un gráfico radial. Los gráficos radiales comparan los valores agregados de varias series de datos (serie de datos: puntos de datos relacionados que se trazan en un gráfico. Cada serie de datos de un gráfico tiene una trama o color exclusivo y se representa en la leyenda del gráfico. Puede trazar una o más series de datos en un gráfico. Los gráficos circulares sólo tienen una serie de datos.).

Los gráficos radiales tienen los siguientes subtipos de gráfico: 3.5.2.2.1 Radial y radial con marcadores Con o sin marcadores para puntos de datos individuales, los gráficos radiales muestran cambios en valores relativos a un punto central.

36


3.5.2.2.2 Radial relleno En un gráfico radial relleno, el área cubierta con una serie de datos se rellena con un color.

3 .6 P OL IGON O DE FRECU ENC IA: U n p o líg o no d e fre c ue nci as s e fo r ma uni e nd o los e xtr e m os d e las b a r ra s d e un d i ag r a ma d e ba r ra s m edi a nte s eg m e ntos . Ta m bi é n se p ued e re a li za r tra za nd o los p unto s q ue r e p re se nta n la s fr ec ue nc ia s y uni é nd o lo s m edi a nte s eg m e ntos . Ej em p lo : La s te m pe r a tur as e n un d ía d e o to ño d e una ci ud ad ha n s ufr i do la s si g uie nte s va ria ci o nes :

H or a T e mp er a tu r a 6

9

12°

12

14°

15

11°

18

12°

21

10°

24

37


3 .6 .1 P o lígo no s d e f r ecu en c ia p ar a da t os ag ru pa do s P a ra c o ns tr ui r e l po líg o no d e fr ec ue nc ia s e to ma la m a r ca de c la se q ue c oi nci de c o n e l p unto m e di o d e ca da r e c tá ng ulo d e un hi s tog r a ma . Ej em p lo : El pe so de 6 5 p e rs on as ad ul ta s v ie ne d ad o p o r la s ig uie n te ta bla : ci

fi

Fi

[ 5 0 , 60 )

55

8

8

[ 6 0 , 70 )

65

10

18

[ 7 0 , 80 )

75

16

34

[ 8 0 , 90 )

85

14

48

[ 9 0 , 10 0)

95

10

58

[ 1 00 , 1 10 )

110

5

63

[ 1 10 , 1 20 )

115

2

65

65

38


3 .6 .2 P o lĂ­g ono d e f re cu en c ia s ac um u la da s si se p r es e nta n la s fr e c ue nci as a c um ula d as d e una ta b la de d a to s a gr up a do s se o b ti e ne e l his tog r a ma de fr ec ue nc ia s a c um ula da s o s u c o r re s po ndi e nte p o lĂ­g o no .

39


DESARROLLE LA SIGUIENTE ACTIVIDAD:

1. Analice los datos contemplados en la siguiente tabla y diseñe algunas graficas para visualizarlos mejor.

EDAD 21 – 25 26 – 30 31 – 35 36 – 40

HOMBRES 7 12 20 15

MUJERES 10 15 12 10

TOTAL 17 27 32 25

TOTAL

54

47

101

RECUERDE QUE SE APRENDE HACIENDO

40


MEDIDAS DE TENDENCIA CENTRAL

41


UNIDAD IV: MEDIDAS DE TENDENCIA CENTRAL

INTRODUCCION Con la presentación de cuadros, graficas y series estadísticas vistas anteriormente, en varios de los casos no es suficiente si se quiere mostrar unos resultados producto de un trabajo de investigación; se hace necesario estudiar otra variables estadísticas que nos permitan definir, calcular e interpretar entre otras la media aritmética para datos originales y para datos agrupados. De igual manera se abordará el estudio de otras medidas de tendencia central como la media, la moda y las desviaciones, cuyo propósito fundamental es el de facilitar el análisis, la interpretación, significado e importancia de estas herramientas de corte estadístico en su aplicación practica, ya que como se ha dado cuenta en el transcurso de las unidades anteriores ningún tema es aislado, es una continuación del método estadístico, que debe cumplirse etapa por etapa. Cuando el estudio se aborda desde una perspectiva de aprendizaje continuo y desarrollando cada una delas actividades propuestas en el material de apoyo, estoy seguro que su proceso de aprendizaje estará fundamentado sobre bases sólidas y los resultados positivos no se dejarán esperar. ANIMO Y ADELANTE.

42


4.1 MEDIA ARITMETICA

__ X

Es una medida de posición que se utiliza para describir y sintetizar mediante un único valor, llamado PROMEDIO, la posición del valor de una variable, de tal forma que se represente al conjunto de valores estudiados. Es una de las medias más conocidas y fácil de calcular, se suele conocer con el nombre de MEDIA O PROMEDIO. Tiene por fórmula:

Es el símbolo de la media aritmética, y su formula es:

Se la obtiene al sumar todos los datos y dividir el resultado entre el número total de datos. Para ello, se aplica la siguiente fórmula:

Ej em p lo : L os p es os d e se is am i go s so n : 8 4 , 91 , 7 2 , 68 , 8 7 y 78 k g . H all a r el pe so m ed io .

M e di a a ri tm é ti ca pa r a d a to s a g r upa do .

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

43


Ej em p lo : E n u n te s t re ali zad o a un g ru po d e 4 2 p e rs on as se ha o b teni do la s p un tu aci on es q ue m ue s tra la ta bla . Ca lc ula r la m e di a .

xi

fi

xi 路 f i

[1 0 , 20 )

15

1

15

[2 0 , 30 )

25

8

200

[3 0 ,40 )

35

10

350

[4 0 , 50 )

45

9

405

[5 0 , 60

55

8

440

[6 0 ,70 )

65

4

260

[7 0 , 80 )

75

2

150

42

1 8 20

4 .1 .1 PR OP IED AD ES DE L A MED IA AR IT M ET IC A

1. La suma de las desviaciones de todas las puntuaciones de una distribuci贸n respecto a la media de la misma igual a cero.

L a s um a d e las d es vi aci o nes d e lo s n煤m e r o s 8 , 3 , 5 , 12 , 1 0 de s u m e di a a ri tm 茅 ti ca 7 ,6 es ig ua l a ce ro .

44


8 − 7 .6 + 3 − 7 .6 + 5 − 7 .6 + 1 2 − 7 .6 + 10 − 7 .6 = = 0 . 4 − 4 .6 − 2 .6 + 4 . 4 + 2 . 4 = 0 2 . L a s um a de lo s c ua d ra do s de la s de s via cio ne s de lo s va lo r e s d e la va ri ab le c o n r es pe c to a un num e r o c ua lq ui e ra se ha c e m íni m a c ua nd o di c ho num e r o c oi ncid e c o n la me dia a r i tmé ti ca .

3 . S i a to do s lo s va lo r es de la va r ia b le se les s um a un m i s mo num e r o , la m edi a a ri tm é tic a q ue da a um e nta da e n d ic ho núm e r o . 4 . Si tod os los va lo r es de la va ri ab le s e m ultip lic a n po r un m i s mo num e r o , la m edi a a ri tmé ti ca q ue da m ulti p li ca da po r d ic ho núm e r o .

4 .1 .2 Ob se rv ac ion es so br e la m ed ia a r it m ét ica 1. La media se puede hallar sólo para variables cuantitativas. 2. La media es independiente de las amplitudes de los intervalos 3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos: 65 kg, 69 kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg, La media es igual a 74 kg, que es una media de centralización poco representativa de la distribución. 4. La media no se puede calcular si hay indeterminada.

un intervalo con una amplitud

Ejemplo: Supongamos que las calificaciones de un estudiante en las distintas asignaturas son las que muestra la tabla. Con base en el promedio de 6, que se aproximará desde 5.5, diga si el estudiante ap rueba o no el año. Química………………. 1 Física…………………. 2 Matemáticas…………..5 Filosofía……………….5 Educación Física……10 Música………………..10 Solución:

45


Cálculo del promedio: _ X = _X_ = 1 + 2 + 5 + 5 + 10 + 10 = 5.5 n 6

Sí aprueba.

Obsérvese que ese resultado es verdaderamente deplorable, sin embargo, matemáticamente cumple la norma; para que el puntaje se vuelva significativo se debe ponderar de acuerdo por ejemplo a la intensidad hora ira semanal, en este caso se tendrá: Materia Química Física Matemáticas Filosofía Ed. Física Música

Calificación 1 2 5 5 10 10

Intensidad horaria semanal 5 5 3 2 1 1

Solución: _ X = < fx <f MATERIA Química Física Matemáticas Filosofía Educación Física Música <

x 1 2 5 5 10 10

f 5 5 3 2 1 1

xf 5 10 15 10 10 10

17

60

Reemplazando en la fórmula: _ X =

60 = 3.53 17

el estudiante no aprueba el curso

4.2 MEDIANA (Me) Es el valor que ocupa el lugar central de todos los datos cuando estos están ordenados de menor a mayor. La mediana se puede hallar solo para variables cuantitativas.

46


4 .2 .1 C AL CUL O D E L A ME D IAN A

1 Or de na mo s los da to s de me no r a m ay o r . 2 Si la s e rie tie ne un n ú m e ro im p ar d e me d id as la m e d ia na es la p un t ua c ión ce n t ra l de la mi s ma . 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5

3 Si la se ri e tie ne un n úm e ro p a r de p untua c io ne s la m e d ia na e s la me d ia e ntr e la s d os p un tu ac ion es c en t r a le s . 7 , 8 , 9 , 1 0 , 1 1 , 12 M e= 9 .5

4 .2 .2 C ALCU L O DE L A ME D IAN A P AR A D AT OS DE V AR IABLE C ON T INU A C ua nd o los da to s se e nc ue ntr a n a gr up ado s e n un c ua d r o de d is tri b uci ó n de fre c ue nci as pa r a va r ia b le co nti nua se ap lic a la s ig uie nte fo r m ula :

Donde: Li = Limite inferior de la clase donde se encuentra la mediana N/2= Semisuma de las frecuencias absolutas Fi-1= Frecuencia acumulada anterior a la clase mediana. ai= Amplitud de la clase La mediana es independiente de las amplitudes de los intervalos.

Ejemplo 1: Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

47


fi

Fi

[ 6 0 , 63 )

5

5

[ 6 3 , 66 ) *

18

23

[ 6 6 , 69 ) * *

42

65

[ 6 9 , 72 )

27

92

[ 7 2 , 75 )

8

100

100 * F r ec ue nc ia a nte rio r ac um ula d a * * M e dia na Me. Se e nc ue ntr a e n e l i nte r va lo do nd e la fr e c ue nci a ac um ula d a lle ga ha s ta la mi ta d d e la s um a d e las fr e c ue nci as a bs o lutas . 1 0 0 /2 = 50 C las e d e la me dia na : [6 6 , 6 9 )

E je mp lo 2 : La e da d de las pe r so na e xp r e sa da e n a 帽o s , se de e n la ta b la a d junta , de te r mi na r e l va lo r de la m edi a na . I. A. C . 10 - 14

I. R .C 9 . 5 - 1 4. 5

F 4

f . A. 4

15 - 19

1 4 . 5- 1 9 .5

5

9

2 0 -2 4 **

1 9 . 5 - 24 . 5

8

17

25 - 29

2 4 . 5 - 29 . 5

2

19

30 - 34

2 9 . 5 - 34 . 5

5

24

24

* * C las e me dia na

Soluci贸n:

Li +

n/2 - < f! f

i

48


Li = n= <f! = i=

Limite real inferior de la clase mediana Tamaño de la muestra o población Frecuencia acumulada anterior a la clase mediana El ancho del intervalo

Clase Mediana:

n = 24 2 2

= 12

El primer intervalo de clase que contiene en las frecuencias acumuladas este valor es: 20 – 24, entonces aplicamos la fórmula así: Me = 19,5 + 12 - 9 8

5

Me = 21,38 años Se podría decir que el 50% de la muestra está por debajo de 21,38 años y el otro 50% está por encima de 21,38 años.

DESARROLLE LA SIGUIENTE ACTIVIDAD:

1-. El jefe de ventas de un establecimiento comercial, investiga los precios de cierto artículo en algunos almacenes del municipio de la Hormiga encontrando los siguientes datos: 70 86 75 72 66 90 85 70 72 81 70 75 84 62 66 74 82 75 68 83 81 65 75 70 85 73 65 82 80 75 68 72 78 84 75 68 84 75 72 80 Se pide: a) Agrupar los datos con un ancho conveniente que usted debe calcular. b) Determinar el precio promedio del artículo. c) Obtener el valor de la mediana e interpretar dicho puntaje, indicando a la vez, cuántos almacenes quedan por debajo y pro encima de dicho precio. 2-. En el problema anterior, encuentre la media aritmética y la mediana considerando el caso como datos no agrupados.

49


4.3 LA MODA (Md) Es el puntaje que mas se repite, es decir el de mayor frecuencia. De acuerdo con esta definición, para datos no agrupados la moda se obtiene por inspección. Por lo cual lo más correcto es hacer primero un arreglo y con base en él, identificar el puntaje o puntajes que más se repiten. Es necesario tener en cuanta que:  Una serie de valores puede carecer de moda.  Una serie de valores puede tener solo una moda, en ese caso se llama Serie Unimodal.  Una serie de valores puede tener dos modas, en ese caso se llama Serie Bimodal.  Cuando la serie de valores o puntajes tiente más de dos modas, se llama Multimodal. Ejemplos: 1-. Calcular la moda de la siguiente distribución ya arreglada: 4, 4, 6, 7, 8, 8, 8, 8, 9, 10, 10, 12, 12, 12, En este caso la moda es 8, que es el puntaje que en este arreglo se repite más veces. 2-. Los precios de un cierto artículo están dados en la tabla, identificar la moda 20, 24, 25, 27, 28, 30, 30, 32, 35, 35, 38, 40 Las modas son: 30 y 35 3-. En una experiencia se lograron los siguientes resultados, identificar la Moda. 5, 6, 8, 9, 10, 15, 18

En este caso no hay moda.

Cuando se trata de datos agrupados, la moda se puede calcular utilizando la siguiente formula: Md = Li + 1

1___ 2

i

Donde: Md = Moda Li = Limite real inferior de la clase modal 1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior. 2 = Diferencia entre la frecuencia de la clase modal y la siguiente i= ancho del intervalo Para la aplicación de esta fórmula lo primero que se debe hacer es identificar la Clase Modal, ésta es, el intervalo de clase que contiene la mayor frecuencia.

50


Ejemplo: Teniendo en cuenta el peso de un grupo de personas expresado en kilogramos, dada en la siguiente tabla, se pide calcular la moda. Peso (Kgs.) 40 - 43 44 - 47 48 - 51** 52 - 55 56 - 59 60 - 63 64 - 67

f 6 12 15 10 7 4 2 56

** Clase modal. Solución: De acuerdo da la definición, la clase modal, corresponde al intervalo de clase, 48 - 51, por que es el de mayor frecuencia, entonces aplicando la fórmula se tiene: Md = 47,5

+ 15 - 12 3 + 5

4

Md = 49 Kgs. Debe recordar que: 1, se obtiene de restar de la frecuencia de la clase modal, la frecuencia de la clase anterior. En este caso el resultado es 3. 2, se obtiene de restar de la frecuencia de la clase modal, la frecuencia de la clase siguiente. En este caso el resultado es 5. Observe que en este caso se ha tomado como ancho de intervalo 4, es decir un número par, porque la agrupación de datos puede hacerse indistintamente, con número par o impar, siendo más prácticos los impares. La moda se puede representar gráficamente en el histograma, para lo cual una vez construido este, se traza dos diagonales a partir de los techos de los intervalos de clase que se encuentran a lada y lado de la barra mas alta que en este caso representa, la clase de mayor frecuencia. El punto de intersección de estas rectas oblicuas, a partir de lo que llamaríamos las diferencias, se lleva la eje horizontal, trazando una perpendicular y donde corte dicha perpendicular el eje horizontal, ahí está la moda. Para verla en cualquier histograma, lleve uno elaborado y trácelo siguiendo las indicaciones pertinentes, de lo contrario consulte con su tutor. La media aritmética y la moda son medidas de posición que se pueden utilizar en conjunto o independientemente si la situación así lo requiere, esto depende de la información que se tiene y el objetivo del estudio.

51


Cuando la distribución es simétrica o aproximadamente simétrica se pueden usar indistintamente ya que sus respectivos valores son casi iguales. Cuando no se quiere ordenar datos y se requieren cálculos estadísticos más profundos se puede utilizar la media aritmética. Si existen valores extremos en la distribución, resulta conveniente utilizar la mediana.

Ejemplo: La Universidad Mariana realiza un examen de matemáticas a los estudiantes del programa de Contaduría Pública, obteniendo las siguientes calificaciones: 8, 8, 7, 6, 8, 7, 5, 3, 2, 4, 8, 2, 3, 4, 10, 9, 8, 7, 6, 8, 9, 9, 10, 8, 3, 4, 5, 4, 3, 8, 2, 9, 10, 7 Se pide determinar el puntaje correspondiente a: a. Q3,

b. Q1.

c. D2,

d. D6 ,

e. D7 ,

f. P40,

g. P60

Solución: Realizamos la primera parte en forma ordenada, identificando cada paso con el numeral correspondiente al proceso ya indicado. a. Cálculo del puntaje correspondiente al Q3 1. Arreglo 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 2. Equivalencia Q3 = P75 3. Lugar: Para determinar el lugar correspondiente al percentil, cuyo puntaje buscamos, se utiliza la formula:

L =

pn 100

Donde: L = es el lugar P = es el percentil equivalente al cuantil problema n = es el número de datos que interviene en la investigación

52


L = pn 100

L = (75) (34) 100

= 25.5

4. Ubicación: 25,5 está entre el lugar 25 y 26 de la serie jerarquizada 5. Interpretación: Se hace con base a la equivalencia del Q3, es decir: El 75% de la población no superan los 8 puntos. b. Calculo del puntaje correspondiente al Q 1 (para mayor agilidad, se han eliminado algunos pasos que usted ya domina). 2. Q1 = P25 3. L = pn = 100

(25) (34) 100

= 8.5

5. El 25% de la población está por debajo de, 4 puntos.

A manera de resumen se puede anotar que:  Las medidas de tendencia central son las que toman en consideración el valor al rededor del cual se agrupan los demás valores de la variable. Este valor representa a todos los datos. Las principales son la Media aritmética, la media y el Mediana.  La media aritmética es la suma de todos los datos dividido por el número de los mismos. Se utiliza cuando se desea una medida de tendencia central bastante confiable y representativa y cuando se quiere tener en cuenta todas las puntuaciones o valores.  La Mediana es una medida de posición ubicada en el centro de una distribución de valores. Se emplea cuando se requiere un cálculo rápido, cuando no haga falta mucha confiabilidad, cuando existan valores extremos que afecten a la media aritmética. Es importante tener en cuenta la practica, desarrollando los ejercicios planteados al o largo del material de estudio, con ello usted logrará una buena destreza y habilidad de pensamiento para resolver problemas homólogos que se pueden presentar en la vida diaria. ANIMO Y ADELANTE.

4.4 MEDIDAS DE POSICION RELATIVA Las medidas de posición relativa se llaman en general CUANTILES y se pueden clasificar en tres grandes grupos: Cuartiles, Deciles, Percentiles.

53


4.4.1 CUARTILES: (Q1, Q2, Q3, Q4). Son aquellos valores que dividen la distribución en cuatro partes iguales, de tal forma que c/u contenga, anterior a su valor, igual numero de observaciones, es decir, el 25%. El valor correspondiente al segundo cuartil es el mismo valor de la mediana de la distribución. Se lo representa con la letra Q. 25% Q1 Q2 Q3 Q4 _________________________________________________

50% De acuerdo a lo anterior cada cuartil representa el 25% de la población

4.4.2 DECILES: Dividen a la recta de puntuación en diez partes iguales, c/u de las cuales se llama Decil y se lo representa con la letra D.

10% D1

D3 D2

D5 D4

D7 D6

D9 D8

D 10

20%

Con base en la gráfica, cada una de las partes representa el 10% de la población.

4.4.3 PERCENTILES: Dividen a la recta de puntuación en 100 parte iguales, c/u de las cuales se llama Percentil y se la representa con la letra P.

P10

P30

P100

1%

El Percentil representa el 1% de la población.

54


Algo importante:

Q2 = D5 = P50 = Mediana

El segundo Cuartil es equivalente al quinto Decil, al percentil cincuenta y a la mediana

55


MEDIDAS DE DISPERSION

56


UNIDAD V: MEDIDAS DE DISPERSION

INTRODUCCION

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media.. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su medi a, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza). Esta medidas también denominadas de variabilidad, además de determinar cual es el valor mas típico, permiten mirar que tan alejados o cercanos al valor promedio se encuentran los demás datos. Para la plena aplicabilidad de todas estas herramientas estadísticas, usted señor estudiante debe fijarse como propósitos fundamentales estudiar a profundidad cada una de estas medidas para su interpretación y utilización de una o varias de ellas, dependiendo de la investigación que esté adelantando; pues al aplicarlas podrá interpretar los resultados obtenidos en relación con las medidas de tendencia central. No olvide disponer del tiempo suficiente para abordar con apropiación toda la temática expuesta en este capitulo, y con base en los anteriores, proceda a reforzar los temas que llevan a la consecución de los objetivos que se planteó al inicio de su carrera profesional. Recuerde que la habilidad y destreza se alcanza cuando ha comprendido y logrado dominar los temas tratados que le permiten solucionar los problemas formulados en él a través de su desarrollo y orientación de su Tutor.

“La ciencia se puede aprender de memoria, pero la sabiduría no” Lawrence Sterne (1713 – 1768) Novelista británico

57


5.1 RANGO O RECORRIDO: El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios. Se le suele simbolizar con R. Para datos no agrupados (variable continua) se obtiene matemáticamente con la siguiente fórmula:

R = Xs - Xo Donde: R = Rango, llamado también AMPLITUD o RECORRIDO Xs = Puntaje mayor de la observación Xo = Puntaje menor de la observación Cuando se trata de datos agrupados en intervalos de clase, la Amplitud o Rango, se considera como la diferencia ente el límite superior de la clase más alta y el límite inferior de la clase más baja.

Ejemplos: 1-. Dada la siguiente distribución sobre la edad de un grupo de personas, calcular el rango. 39, 38, 28, 45, 52, 48, 32, 43, 24, 58, 45, 38, 37, 38, 25, 34, 46, 48, 56, 34, 46, 58, 69, 27, 35, 45, R/.

Xo = 27 Xs = 69 R = Xo – Xs R = 69 - 27 = 42

Interpretación: Este valor se puede considerar alto, ya que se puede trata de un grupo bastante heterogéneo por la respuesta obtenida, por tanto la media aritmética no es recomendable tenerla en cuenta como parámetro de comparación, pues no resulta confiable. Recuerde que la interpretación depende de que tan grandes sean los valores.

2-. La producción en unidades de calzado por hora está dada en el siguiente cuadro, se pide encontrar la amplitud de dicha observación: I.C.

ni

10,6 – 15,5 15,6 – 20,5 20, 6 – 25,5 25,6 – 30,5 30,6 – 35,5

2 3 8 4 3 20

58


R/.

Limite Superior de la clase más alta ….. 35,5 Limite Inferior de la clase más baja…… 10,6 Amplitud = Diferencia………………… 24,9

5.2 DESVIACION MEDIA: (DM) Es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por DM ( o por Dx).

E je mp lo 1 : C a lc ula r d is tri b uci ó n:

la

d e s vi a ció n

m e di a

da da

la

si g uie nte

9, 3, 8, 8, 9, 8, 9, 18 X = 9 + 3 +8 +8 +9 + 8 + 9 + 18 = 9 8

5 .2 .1De sv iac ión m ed ia pa r a d a tos ag r upa do s

Si lo s da to s vi e ne n ag r up ad os e n una tab la d e fre c ue nci as , se a p li ca la sig ui e nte fó r m ula :

59


E je mp lo 2 : Ca lc ula r la d e s vi ac ió n m e dia de la dis tri b uci ó n:

xi

fi

x i · fi

| x - x|

| x - x| · f i

[1 0 ,1 5 )

1 2. 5

3

3 7. 5

9 .2 8 6

2 7. 8 58

[1 5 ,2 0 )

1 7. 5

5

8 7. 5

4 .2 8 6

2 1. 4 3

[2 0 , 5 )

2 2. 5

7

1 5 7. 5

0 .7 1 4

4 .9 9 8

[2 5 ,3 0 )

2 7. 5

4

110

5 .7 1 4

2 2. 8 56

[3 0 ,3 5 )

3 2. 5

2

65

1 0. 1 74

2 1. 4 28

21

4 5 7. 5

X = 45 7 .5 21

9 8. 5 7

= 2 1 .7 86

D x = 9 8 .5 7 = 4 .6 9 21 Ejemplo 3: Los salarios de un grupo de empleados (en miles de pesos) son: 35, 38, 40, 41, 43, 45, 46, 48, 50, 54, 56, 60, Se pide encontrar: a. El salario promedio b. El rango c. La desviación media R/. a. cálculo del salario promedio X =

x = 35 + 38+ 40+ 41+ 43+ 45+………….+ 60 = 556 = 46,33 N 12 12

b. Cálculo del rango R = Xs - Xo R = 60 - 35 = 25 c. Cálculo de la Desviación Media Tabla que se construye con base en los datos y teniendo en cuanta la fórmula de la desviación media.

60


x 35 38 40 41 43 45 46 48 50 54 56 60

/x - x/ 11,33 8,33 6,33 5,33 3,33 1,33 0,33 1,67 3,67 7,67 9,67 13,67

Cálculos DM = (/X - X/) N DM = 72,66 12 DM = 6,06

72,66

DESARROLLE LA SIGUIENTE ACTIVIDAD :

1-. Los precios de un cierto artículo en diferentes almacenes son: 38, 38, 39, 40, 41, 43, 43, 43, 44, 44, 44, 45, 45, 45, Encontrar la desviación media.

2-. La edad en años de un grupo de personas que labora en la Fábrica “Pemiro Ltda” es: 20, 23, 23, 24, 25, 25, 25, 27, 27, 28, 29, 30, 30, 31, 31, 32, 32, 35, 35, 35, 38, 38, 39, 40, 42, 42, 43, 43, 45, 45, 46, 48, Se pide obtener una distribución de frecuencias con datos agrupados en intervalos de clase, con ancho 5 y obtener la desviación media.

2

5.3 VARIANZA (S ) Es la media aritmética de los cuadrados de las desviaciones respecto a la media de una distribución estadística. Su importancia radica en que da origen a la medida de dispersión más significativa que es la desviación típica o estándar (S).

61


L a v a r ia n z a s e r e p r e s e n ta p o r

.

5 .3 .1 Va r ian za pa r a dat os a gru pa do s

P a ra

si m p li fi ca r

el

c 谩 lc ulo

de

la

va r i a nza ,

se

uti li za

la s

s ig uie nte s e xp re sio ne s q ue s o n eq ui va le ntes a las a nte rio r e s .

V a r ia n za par a da to s a gr u pa do s

E je rc ic io s d e v ar ianz a Calcular la varianza de la distribuci贸n: 9 , 3 , 8 , 8 , 9 , 8 , 9 , 18

62


C a lc ula r la va ri a nza d e la di s trib uc ió n d e la tab la :

xi

fi

xi · fi

x i 2 · fi

[1 0 , 2 0 )

15

1

15

225

[2 0 , 3 0 )

25

8

200

5 0 00

[3 0 ,4 0 )

35

10

350

1 2 25 0

[4 0 , 5 0 )

45

9

405

1 8 22 5

[5 0 , 6 0

55

8

440

2 4 20 0

[6 0 ,7 0 )

65

4

260

1 6 90 0

[7 0 , 8 0 )

75

2

150

1 1 25 0

42

1 8 20

8 8 05 0

5 .3 .2 PROP I EDA D ES D E LA VAR IA NZA

1 L a v a r ia nz a se r á s ie m pr e un v a lo r p os it ivo o c e ro , e n e l c as o de q ue la s p untua c i o nes s ea n ig ua le s . 2 Si a to do s lo s v a lo r es d e la va ri ab le se le s su m a un n ú me ro la va r ia nz a n o v a r ía .

63


3 Si to do s lo s v a lo r es d e la va ri ab le se m u lt ip lica n po r un n ú m e r o la va r ianz a q ue da m u lt ip lica da p o r e l cu ad ra do d e dic ho nú me r o . 4 Si te ne m os va r ia s dis tri b uci o nes c o n la m is m a me d ia y c o no c e mo s s us r es pe c ti va s v a r ia nz as s e p ue de ca lc ula r la v a r ia nz a to t a l . Si to da s la s m ue s tra s tie ne n e l m is m o ta m a ño :

Si la s m ues tr as tie ne n di s ti nto ta ma ño :

5 .3 .3 Ob se rv ac ion es so br e la v ar ianz a 1 L a va r ianz a , a l i g ua l q ue la m edi a , es un índ i c e m uy s e nsi b le a las p untua c io ne s e xtr e m a s . 2

E n lo s c a so s q ue

no s e p ued a

ha lla r la

me dia

ta m po c o s e rá po si b le ha lla r la v a r ia nz a . 3

La

va r ianz a

no

vie ne

e xp re sa da

e n la s m is m as

uni d a de s q ue los da to s , ya q ue las de s via cio ne s es tá n e le va da s a l c ua d ra do . Otro ejemplo: Las ventas diarias (en miles de pesos), de un almacén durante una semana son las siguientes: Lunes… 50 Martes … 45 Miércoles… 52 …75 Sábado… 80 Se pide encontrar: a). el promedio de ventas

Jueves …60

Viernes

64


b). La varianza Solución: a. Calculo del promedio X = ____X

= 362

n

= 60,33

6

º b. Calculo de la varianza Tabla que se construye X 50 45 52 60 75 80

X - X

-

10,33 15,33 8,33 0,33 14,67 19,67

(x - X )2 106,71 235 69,39 0,11 215,21 386,91 1013,33

2 S

= ___(x - x)2

= 1013,33

n

=

168,89

6

5.4 DESVIACION TIPICA O ESTANDAR (S). Es la medida de dispersión más importante y se define como la raíz cuadrada de la varianza. Se puede definir también como la raíz cuadrada de las desviaciones respecto a la media. Mide el grado de desviación promedio de los valores con respecto a la media. Fórmulas: para variable discreta (cuando se tiene datos no agrupados)

S =

( x - x) 2 n

S=

__ f (Xj - x) 2 N

Cuando se trata de datos no agrupados

Para datos agrupados

Donde: S = Desviación Estándar X = Es el puntaje

65


Xj = Es la marca de clase f = Es la frecuencia n = Número de elementos que intervienen, en datos no agrupados y tamaños de la muestra, en datos agrupados X = Es la media aritmética Ejemplo 1-: Calcular el rango, desviación media, varianza y desviación típica de los siguientes datos de la variable discreta: X1 = 42

X2 = 68

X3 = 69

El rango R = 72 – 42

X4 = 69

X5 = 72

R = 30

Para la desviación media, varianza y desviación típica se organiza los datos en un cuadro: X=

Xi n

X = 42 + 68 + 69 + 69 + 72 5 X = 64 Xi 42 68 69 69 72

(X - X)

22 4 5 5 8

(x - X )2 484 16 25 25 64

5

44

614

Desviación Media

DM = 44/5

Varianza

S 2= 614/5

Desviación típica

S =

DM = 8,8

s2 = 128,8

614 5

S = 11,08

Ejemplo 2-. El salario de 50 empleados de una empresa está dado en miles de pesos según la siguiente tabla: 20 27 32 32

25 25 26 31

27 28 21 30

28 28 28 25

29 29 34 24

23 28 31 34

24 26 28 29

30 30 20 27

30 30 30 22

25 27 30 23

22 25 29 32

23 27 20

32 32 23

66


a. Calcular el salario promedio b. calcular la desviación estándar, agrupando con ancho 5. R/. Tabla que se construye con base en las formulas

I. A. C. 20 - 24 25 – 29 30 – 34

f

Xj

12 22 16

22 27 32

fXj 264 594 512

50

(Xj – X) -5,4 -0,4 4,6

(X – X)2 29,16 0,16 21,16

1370

f(X – X)2 349,42 3,52 338,56 692,00

a. Calculo de la media: X =

fXj n

S=

=

1370 = 27,4 50

__ f (Xj - X) 2 n

=

692 = 3,72 50

DESARROLLE LA SIGUIENTE ACTIVIDAD:

1. En un examen de Estadística realizada a 120 estudiantes se logró de una muestra tomada al azar, los 40 puntajes siguientes: 45, 45, 45, 48, 48, 48, 50, 50, 52, 52, 55, 55, 55, 55, 60, 60, 62 ,64, 64, 64, 66, 66, 66, 68, 68, 68, 68, 68, 70, 70, 70, 73, 74, 74, 77, 77, 77, 80, 80, 80 Se pide agrupar los datos con ancho 5 y obtener la desviación estándar. 2. Con base en los siguientes datos encontrar: Media Aritmética, Varianza y Desviación Estándar. 8, 9, 10, 12, 14, 15, 15, 15, 17, 19, 22, 23, 25, 27, 27, 28

67


INTRODUCCION AL CÁLCULO DE PROBABILIDADES

68


UNIDAD VI: INTRODUCCION AL CÁLCULO DE PROBABILIDADES

INTRODUCCION Lo estudiando hasta el momento solo brinda la posibilidad de hacer una descripción de un conjunto estudiado; pero para llegar a profundizar más sobre el tema y darle mas consistencia a una determinada investigación, se hace necesario abordar otra temática más compleja que no se tratará en este compilado. Pero que en esta unidad se trata de dar una visión global de lo que se conoce como estadística Inferencial la cual permite deducir (inferir) propiedades o características de una población a partir de una muestra significativa. En esta unidad se estudiará el concepto de probabilidad, las permutaciones, variaciones y combinaciones con el propósito de dejar sembrado en el educando la inquietud de seguir profundizando en el tema al poner en práctica Todos los temas aprendidos y que se hace necesario un mayor conocimiento y aplicación. Existen cualidades secretas que conducen a la felicidad, algo indefinible que el hombre lleva dentro de si y para los cual no encuentra nombre” F. Bacon.

6.1 PROBABILIDAD

La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos. La probabilidad constituye un importante parámetro en la determinaci ón de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.

69


Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabilísticos en regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos de su probable efecto en la población como un conjunto. No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad de otro 11-S". Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabilísticas un tema político. Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio - que producen un efecto dominó en la economía en conjunto. Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable probablemente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y en la paz y en los conflictos.

6.2 CONCEPTOS FUNDAMENTALES 6.2.1 Fenómeno aleatorio Se dice que un fenómeno es aleatorio cuando son factores al azar o de incertidumbre los que determinan su ocurrencia o no ocurrencia, es decir su resultado se da sin seguir un plan determinado. Son ejemplo de fenómenos aleatorios:  Lanzar una moneda para ver si cae cara o sello  El numero de artículos defectuosos que produce una maquina  El numero de clientes que se acercan a una ventanilla de pagos de un banco.  Lanzamiento de un dado normal para observar los puntos de la cara superior.  El resultado de un sorteo de la lotería El Baloto  El numero de llamadas que reciben en una central de teléfonos 6.2.2 Experimento Estadístico Prueba o hecho obtenido den un conjunto de resultados posibles. Por ejemplo lanzar 3 monedas para observar el numero de sellos, examinar una muestra de

70


artículos producidos por una misma maquina para observar la cantidad de defectuosos, etc. 6.2.3 Suceso o Evento Aleatorio Es un resultado posible o una combinación de resultados posibles que se dan en un experimento de un fenómeno aleatorio. Un suceso se considera imposible, cuando su resultado conduce a escoger un elemento que no pertenece a los sucesos posibles. Ejemplo: En el lanzamiento de la moneda en condiciones normales el conjunto de sucesos posibles es: S = {cara, sello}. Y el conjunto de sucesos imposibles podría ser: S = {x7x no sale ni cara ni sello}. Los elementos en los anteriores ejemplos se consideran MUATUAMENTE EXCLUYENTES, lo que significa que cada relación del experimento solo se le puede asignar un resultado. Ejemplo: al lanzar la moneda al aire o sale cara o sello, no pueden ocurrir los dos sucesos a la vez. 6.3 CALCULO DE LA PROBABILIDAD Si se considera a P(A) como la probabilidad de ocurrencia del suceso A entre un número N de casos posibles de ocurrencia:

P(A) = Sucesos Favorables Sucesos Posibles Ejemplo: Si se lanza una moneda una vez, hallar la probabilidad de que aparezca el resultado sello: M = {x7x sale sello} S = {Cara, Sello} El conjunto de sucesos posibles P(M) = 1_ 2

P(M) = 0,5 = 50%

En un lanzamiento puede salir un solo sello. Los sucesos posibles son dos: sello y cara.

Ejemplo: al lanzar un dado normal una sola vez calcular: a-. La probabilidad de que aparezca el numero 2 b-. La probabilidad de que aparezca el numero 3

71


c-. La probabilidad de que aparezca un número impar d-. La probabilidad de que aparezca un número mayor que 4 a-. Sea A = {aparece número 2} S = {1, 2, 3, 4, 5, 6} P(A) = 1_ 6

P(A) = 0,1667 = 16,67%

b-. Sea B = {aparece el número 3} S = {1, 2, 3, 4, 5, 6} P(B) = 1_ 6

n(A) = 1 n(S) = 6

n(B) = 1 N(S) = 6

P(B) = 0,1667 = 16,67%

c-. Sea C = {aparece número impar} S = {1, 2, ,3 ,4, 5 ,6} P(B) = 3_ 6

n(C) = 3

Simplificando

P(C) = 1 = 0.5 = 50% 2

d-. Sea D = {aparece número mayor que 4} D = {5, 6} S = {1, 2, 3, 4, 5, 6} P(D) =

2_ 6

n(D) = 2 N(S) = 6

Simplificando P(D) =

1 = 0,3333 = 33,33% 3

En los anteriores ejemplos observe que la probabilidad se expresa como una proporcionalidad entre los casos favorables y los casos .totales. El resultado es un número comprendido entre cero y uno.

O < P(A) < 1 La probabilidad es exactamente cero para un suceso imposible La probabilidad es exactamente uno para los sucesos posibles Ejemplo: Se lanzan 2 monedas una sola vez. Calcular las siguientes probabilidades. a-. De que salgan 2 caras. b-. De que aparezcan cara y sello. c-. Que no aparezcan 2 caras. El conjunto de sucesos posibles:

72


S = {cara, cara), (cara, sello), (sello, cara), (sello, sello)} a-. Sea A = {aparecer 2 caras}

n(S) = 4

A = {(cara, cara)}

n (A) = 1

P(A) = 1 = 0.25 = 25% 2 b-. B = {Aparecer cara y sello} n(B) = 2

B = {(cara, sello), (sello, cara)}

P(B) = 2 = 1 = 0.5 = 50% 4 2 c-. C = {No aparecer 2 caras} n(C) = 3

C = {(cara, sello), (sello, cara), (sello, sello)}

P(C) = 3 = 0.75 = 75% 4

DESARROLLE LA SIGUIENTE ACTIVIDAD:

1. ¿Cuál es la probabilidad de sacar un as al azar un dado una vez? 2. Calcular la probabilidad de sacar 2 caras, al lanzar 2 monedas simultáneamente. 3. Calcular la probabilidad de obtener as al extraer una carta de una baraja de 52 cartas. 4. Una caja contiene 50 bolas, de las cuales 20 son verdes y 30 azules. Calcular la probabilidad que al extraer una bol esta sea: a. Azul b. Verde 5. Calcular la probabilidad de que la suma sea 6 puntos en el lanzamiento de un par de dados. 6. Calcular la probabilidad de que no salga 1 al lanzar dos dados. 7. En una bolsa se introducen 20 fichas numeradas del 1 al 20. Calcular la probabilidad de que al hacer una extracción el número obtenido sea impar.

73


6.4 FACTORIAL DE UN NUMERO n (n!) Es una operación matemática que consiste en el producto de n factores, decrecientes de unidad en unidad, partiendo de n:

n! = n(n-1), (n-2), (n-3) …1

Ejemplo 1: Un experimento consiste en asignar 5 tareas distintas a c/u de los trabajadores de una empresa. De cuantas maneras distintas se pueden asignar dichas tareas, si la empresa cuenta para realizarlas con: a. 8 trabajadores? b. 5 trabajadores? Solución: a-. Se tiene n = 8 trabajadores para realizar k = 5 tareas. Entonces el número de maneras que se pueden asignar 5 trabajadores de 8 para hacer 5 tareas distintas serán: 8P5 =

8! (8 – 5)!

= 8! = 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 6.720 3! 3 x2 x 1

b-. Se tienen 5 trabajadores para realizar 5 tareas distintas. El número de maneras que se pueden asignar estos trabajadores es: 5P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120

Ejemplo 2:

5! = 5x4x3x2x1 5! = 120

Ejemplo 3:

8! = 8x7x6x5x4x3x2x1 8! = 40.320

6.5 PERMUTACIONES Una permutación es una combinación en donde el orden es importante. La notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n” elementos si solamente se seleccionan “r”. La formula utilizada para calcular permutaciones es Pn = n! y se lee: “permutaciones de n elementos”

74


Pn = n! Ejemplo 1: Si nueve estudiantes toman un examen y todos obtienen diferente calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda calificación más alta podría ser obtenida por uno de los 8 restantes. La tercera calificación podría ser obtenida por uno de los 7 restantes. La cantidad de permutaciones posibles sería: P(9,3) = 9*8*7 = 504 combinaciones posibles de las tres calificaciones más altas. Ejemplo 2: Calcular las siguientes permutaciones: 1-. P7 2-. P10 3-. P3 P7 = P7 = 7X6X5X4X3X2X1 2-. P10 =P10 = 10X9X8X7X6X5X4X3X2X1 3-. P3 = P3 = 3X2X1 1-.

P7 = 5.040 P10= 3.628.800 P3 = 6

Ejemplo 3: ¿De cuantas formas pueden ordenarse 4 libros en un estante? Aquí se observa que es importante el orden de los elementos, por lo tanto la respuesta viene dada encontrando P4. P4 = 4!

P4 = 24

R/. De 24 formas diferentes.

6.6 COMBINACIONES Son ordenaciones en la cuales no se tiene en cuenta el orden de los elementos. La fórmula utilizada es:

Cn,r =

n! ___ R!(n – r)!

Ejemplo 1: Si se toman las letras M, N, R ¿Cuántas combinaciones se pueden hacer, si solo se toman do de ellos? MN = NM

NR = RN

MR = RM

Aquí como no importa el nombre se observa que dos de ellas son iguales. Aplicando la fórmula:

75


C3,2 =

3!____ 2!(3 – 2)!

C3,2 =

3!____ 2!1!

C3,2 = 3 x 2 x 1 2 x1 x1 C3,2 = 6 2

C3,2 = 3

R/. 3 parejas de números

Ejemplo 2: Cuantos comités diferentes se pueden conformar con un grupo de 10 personas si se desea formar un comité de 3 personas? En este caso el orden de las 3 personas no tiene importancia, luego: C10,3 =

10!___ = 10! = 10 x 9 x 8 = 120 R/. Número de comités. 3!(10 – 3)! 3!7! 3 x2 x1

DESARROLLE LA SIGUIENTE ACTIVIDAD:

1. Un Fondo de Empleados cuenta con 20 socios, 5 de los cuales son mujeres, si la junta directiva, compuesta por 3 miembros, se elige al azar, hallar la probabilidad de que: a. La junta esté compuesta solamente por mujeres b. Solamente por hombres c. Exactamente una de ellas esté en la junta 2. Se lanza un dado 3 veces consecutivamente, hallar la probabilidad de obtener un doble.

Recuerde que: 1. La probabilidad es un porcentaje o proporción de los resultados favorables a un suceso respecto al número total de acontecimientos considerados. 2. El calculo de probabilidades es una parte de la matemática que se ocupa de establecer reglas generales para el análisis de aquellos fenómenos que se repiten varias veces.

76


GLOSARIO ALEATORIO: Procedimiento o fenómeno que depende de lazar. ATRIBUTO: Característica propia de las variables cualitativas. CALCULO DE PROBABILIDADES: Parte de las matemáticas que estudia y plantea reglas para fenómenos que se repiten varia veces. CUANTILES: Medidas de posición que dividen una distribución en cuatro partes iguales (Cuartiles), diez partes iguales (Deciles) ocien partes iguales (percentiles). DESVIACION MEDIA: La media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética. DESVIACION TIPICA: Medida de dispersión más significativa. Corresponde a la raíz cuadrada de la varianza. DIAGRAMA: Gráfica representativa que permite la visualización de un conjunto de datos estadísticos. DIAGRAMA DE FRECUENCIAS: Grafica de una variable discreta organizada en una distribución. DISTRIBUCION DE FRECUENCIAS: Ordenación y organización de datos de clase o intervalos de clases. DISPERSION: Grado en que un conjunto de datos se extienden al rededor de un valor medio. ESCALA: Sistema de proporción mediante el cual algunas magnitudes representan a otras mayores en un diagrama. ESPACIO MUESTRAL: Conjunto de todos los posibles resultados obtenidos en un experimento. EXPERIMENTO: Prueba organizada que permite obtener información acerca de un fenómeno que se quiere estudiar. FRECUENCA ABSOLUTA: Es el número de veces que puntuación.

se

repite

cada

FRECUENCIA ACUMULADA: Frecuencia total que contiene todos los valores menores que el limite superior del intervalo de clase estudiado. FRECUENCIA RELATIVA: Es el tanto porciento obtenido de dividir cada frecuencia absoluta por el total de todas las frecuencias de todas las clases.

77


INTERVALO DE CLASE: Conjunto de valores o datos entre dos limites. MARCA DE CLASE: Punto medio de un intervalo de clase. MEDIANA: Medida de posición que ocupa la parte central de la distribución. MEDIA ARITMETICA: LA relación entre la suma de todos los datos y la suma de todos ellos. MEDIA GEOMETRICA: Medida de tendencia central utilizada en distribuciones que crecen o decrecen geométricamente. MODA: Medida de tendencia central que corresponde al dato que más se repite. PROBABILIDAD: Porcentaje o participación que se obtiene de la relación entre los resultados favorables con respecto al total. PROMEDIO: Valor típico o mas representativo de todos los datos. RANGO: Diferencia ente el mayor datos y el menor dato. SUCESO: Cada uno de los resultados obtenidos al hacer un experimento. SUMATORIA: Forma abreviada de indicar la suma de una gran cantidad de términos que guardan entre sí una relación. TABULACION: Proceso mediante el cual se agrupan datos estadísticos en cuadros o tablas. UNIDAD DE INVESTIGACION: Es la fuente de donde se toma la información en una investigación. Puede ser un grupo, una institución, un individuo. VARIABLE: Los rangos, características o propiedades que tienen los elementos de un conjunto de estudio. VARIANZA: Medida de dispersión equivalente al cuadrado de la desviación estándar o típica.

78


BIBLIOGRAFIA

ARGOTY H. Luis G. Estadística General. Universidad Mariana. Facultad de Educación a Distancia. Pasto. ARGOTI C. Francisco J. Estadística Descriptiva. Facultad de Educación a Distancia. Pasto.

Universidad Mariana.

BARBANCHO, Alfonso. Estadística elemental moderna. Ariel. Barcelona. BEJARANO BARRERA, Hernán. Estadística Descriptiva. Módulo para Universidad A Distancia. Unidad universitaria del Sur de Bogotá 1986. I.C.F.E.S. Serie Aprender a Investigar. Información. Técnicas Estadísticas.

Módulo 4.

El análisis de la

Modulo de Estadística Aplicada. Universidad Mariana. Facultad de Educación a Distancia. PEREZ MENDEZ, Álvaro. Estadística Descriptiva. Escuela Superior de Administración Pública,

Módulo Autoformativo.

SPIEGEL, Murray R. Estadística. Serie Schaums. Mc. Graw Hill. México, 1989. BOLETIN ESTADISTICO, Universidad Mariana. Desarrollo Institucional. Pasto. 2010.

Oficina de Planeación y

TORRES DE CASTRO, Luz Stella. Manual Práctico de Estadística. PIME S.A. Bogotá Colombia, 1986.

79


CIBERGRAFIA htpp://www.wikipedia .com,html. htpp://www.umariana.edu.co. htpp://www.slideshare.net/fmatinezsolaris/. htpp://www.alcaste.com/departamenteo/matematicas/.html htpp://www.santiagosapostol.net/matematicas/joaquina-pdf. htpp://www.vitutor.net/2/11/graficas_estadistica.html. htpp://www.google.com.co/imagenes?imgurl. htpp://picses.eu/keyword/grรกficadeestadistica/. Htpp://es.wikipedia.org/wiki/medidasdedispersion/.

80


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.