Introducción Probabilidad y Estadística PI-2610 Probabilidad y Estadística I Marco Alvarado Peña
Sesión 1
En este curso de Probabilidad y Estadística I se da el primer acercamiento a la carrera de Ingeniería en Producción Industrial. El resto de su vida estudiantil, este herramienta la utilizará en los cursos medulares y en trabajos de proyecto de curso varios. Su importancia radica en que gracias a éste rama de la matemática, usted podrá hacer análisis numéricos de situaciones y propuestas a nivel industrial en los procesos y servicios, en el mercado laboral. Por lo tanto he aquí los objetivos de aprendizaje, los cuales usted debe dominar.
2
Objetivos de Aprendizaje El siguiente curso lo que busca es que el estudiante sea capaz de:
1. Recolectar los datos con bases estadísticas sólidas que le den validez a los estudios que se realizan. 2. Analizar la información seleccionando para tal fin aquella técnica estadística que mejor se adecue a las características de los datos obtenidos 3. Aplicar los conceptos de distribución de probabilidad para estudiar el comportamiento de los fenómenos físicos que ocurren aleatoriamente. 4. Conocer y aplicar los conceptos de muestreo estadístico de tal manera que las inferencias realizadas a partir de muestras tengan confiabilidad y validez estadística
3
Índice Para la primera clase tiene aquí los temas más relevantes que incluso puede consultar en la bibliografía descrita en el programa de curso
Introducción Probabilidad y Estadística.................................. 1 Objetivos de Aprendizaje....................................................... 3 Conceptos y Definiciones...................................................... 7 Análisis estadístico versus estadística................................ 8 ¿Qué es estadística?............................................................ 8 ¿Qué es análisis estadístico?............................................... 9 Método científico.................................................................... 11 Población y Muestras............................................................. 13 Parámetros Poblacionales vs. Estadísticos Muestrales....... 14 Estadísticos Muestrales son Variables Aleatorias................ 15 Variables y atributos.............................................................. 16 Unidades estadísticas elementales...................................... 17 Estadística descriptiva versus estadística inferencial....... 18 Estadística Descriptiva.......................................................... 19 Definición y elementos.......................................................... 19 Distribución de frecuencias................................................... 21 Distribución de datos agrupados.......................................... 22 Distribución de datos no agrupados..................................... 23 Pasos para agrupamiento de datos (Procedimiento)........... 24 4
Ejemplo 1.............................................................................. 25 Ejercicio 1............................................................................. 28 Ejercicio 2..............................................................................29 Ejercicio 3............................................................................. 30 Gráfico de frecuencias........................................................... 31 Gráficos de barras.................................................................31 Gráfico de bastones.............................................................. 34 Histogramas.......................................................................... 35 Polígonos.............................................................................. 36 Gráficos hoja y tallo...............................................................38 Gráficos de caja.................................................................... 41 Referencias............................................................................. 45
5
Hoy nuestra clase inicia como todo proceso por lo m谩s b谩sico, a continuaci贸n revisaremos los conceptos y definiciones que introducen al futuro ingeniero en Producci贸n Industrial, en su quehacer diario.
6
Conceptos y Definiciones - Análisis estadístico versus estadística - Método científico - Poblaciones y muestras - Variables y atributos - Unidades estadísticas elementales - Estadística descriptiva versus estadística inferencial
Se ha preguntado antes del día de hoy ¿qué es la estadística? ¿de qué trata el análisis estadístico?. La Real Academia Española nos presenta la siguiente propuesta.
7
Análisis estadístico versus estadística ¿Qué es estadística?
1- f. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
2- f. Conjunto de estos datos.
3- f. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. Diccionario Real Academia Española
8
Para llegar a un punto más cercano a la ingeniería en Producción Industrial es importante ahora aprender el siguiente tema. Por favor léalo con calma y piense en algunos ejemplos de la vida real en los cuales se aplica lo siguiente.
¿Qué es análisis estadístico?
1- m. Distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos.
2- m. Examen que se hace de una obra, de un escrito o de cualquier realidad susceptible de estudio intelectual. Diccionario Real Academia Española
9
Una palabra que debe tener
concretas para una correcta
riguroso análisis de datos
presente y que si no la conoce
toma de decisiones. Es por ello
gracias a ésos números que
este es el momento de
que a continuación se le
revelan los verdaderos síntomas
incorporarla a su vocabulario
presenta los pasos de dicho
de dicho problema. Esto
profesional es: inferir, inferencia.
método, para que se familiarice
precisamente es lo que verá en
El análisis estadístico conlleva la
y lo recuerde cuando lo estudio
el punto 1 del método científico.
notación de inferir, de inferencia,
en la secundaria. Además para
es decir, de concluir a partir de
que lo aplique ya que
un todo y con la ayuda de una
usualmente lo que hacemos es
muestra, para tomar una
medio entender un problema y
decisión.
pensar en automático en una solución, obviando toda la etapa
El análisis estadístico no se
de análisis, y transición para
debe hacer sin planificación, sin
llegar a conclusiones
preparación, utilizando
satisfactorias. Recuerde un
herramientas al azar. Para ello
problema es problema cuando
el método científico es una
cuantitativamente se puede ver
excelente metodología para
el impacto del mismo en una
estructuradamente analizar una
situación dada y por lo tanto, se
situación y llegar a conclusiones
puede tratar a partir de un 10
Método científico 1- Desarrollar una descripción clara y concisa del problema. 2- Identificar, al menos de manera tentativa, los factores importantes que afectan el problema o que pueden jugar un papel en su solución. Aquí puede usar algunas herramientas ingenieriles como un diagrama de Ishikawa, Diagrama de Pareto, entre otros. 3- Proponer un modelo para el problema, utilizando los conocimientos científicos o de la ingeniería del fenómeno bajo estudio. Consignar todas las limitaciones y/o supuestos del modelo. El concepto de modelo debe aprenderlo porque como sujeto de aprendizaje es lo que aplicará en la vida real. Un modelo es una abstracción de la realidad, una simplificación de la realidad para describir y entender un determinado comportamiento. 4- Realizar los experimentos apropiados y recolectar datos para probar y validar el modelo tentativo o las conclusiones planteadas en los pasos 2 y 3. 5- Refinar el modelo con base en los datos observados.
11
6- Manipular el modelo para contribuir a desarrollar una solución del problema. 7- Realizar un experimento apropiado para confirmar que la solución propuesta del problema es efectiva a la vez que eficiente. Los experimentos más exactos y precisos es cuando se sigue una metodología científica como lo es el DOE (Design of experiments – Diseño de Experimentos), materia que verá en cursos posteriores de la carrera 8- Sacar conclusiones o hacer recomendaciones con base en la solución del problema.
12
Población y Muestras ¿Cuál es la altura promedio de los costarricenses? En estadística se toma un estadístico muestral y se infiere sobre un parámetro de la población.
Fig 1. Población vs Muestra
En estadística estas dos palabras
Teniendo ya claro los conceptos de población y muestras es
son protagónicas, debe
importante que distinga también la diferencia entre un parámetro y un
distinguirlas muy bien y sobre todo
estadístico. Pareciera que no hay diferencia alguna, pero no se
aplicarlas en la recolección de datos y en la inferencia estadística
precipite, sí la hay. En el cuadro que sigue puede verlo y deducirlo.
propiamente. A partir del ejemplo y figura que se le muestra aprenda qué es una población y qué es una muestra.
13
ParĂĄmetros Poblacionales vs. EstadĂsticos Muestrales
DefiniciĂłn
ParĂĄmetro Poblacional
EstadĂstico Muestral
Es el valor verdadero de una
Es un nĂşmero que es calculado de los
caracterĂstica de la poblaciĂłn
datos de una muestra
- Valor fijo - Usualmente desconocido
- Variable aleatoria: diferente para cada muestra - Usado para estimar parĂĄmetros poblacionales
Denotados por las letras
Griegas - Verdadera Media= Îź - Verdadera Desv Estad= Ďƒ
Ejemplo
Romanas
- Media muestral= �̅ - Desv Estad Mestral= s
Altura promedio de los
Altura promedio de una muestra de 16
costarricenses
costarricenses
ÂżCree usted que pueda dar otros ejemplos para distinguir entre una u otra? Adelante...hĂĄgalo
14
Estadísticos Muestrales son Variables Aleatorias Supongamos que sabemos los parámetros poblacionales:
Fig 2. Estadísticos Muestrales
Los estadísticos muestrales son variables aleatorias porque desconocemos su valor hasta que por una recolección de datos se pueden calcular, de ahí que pueden tomar cualquier valor, tantas veces se saquen muestras diferentes. 15
Otro concepto importante que
Variables y atributos
debe usted dominar es el de
“X” es una variable estadística si es cuantitativa, es decir, se puede
variable y atributo, no son lo
medir, y si a cada “X” se le puede asociar un número, del que se dice
mismo, ya verá a continuación:
es el valor de dicha variable. Ejemplos: altura, peso, temperatura, pureza.
- Una variable estadística es discreta si su número de modalidad es finito (cantidad de hijos de una familia). Si el número de posibles valores que puede tomar es contable (números naturales) y no lo puede fraccionar, ejemplo: una mujer está embarazada o no, no se dice que esta ¾ embarazada ¿cierto?
- Será continua si su número de modalidad es infinito. Si sus posibles valores están en el continuo (números reales). Generalmente resultan de un proceso de medición
Un atributo es cualitativo, si no es medible es calificativo como por ejemplo: sexo, bonito, feo, bueno, malo, entre otros.
16
A manera de repaso, aunque lo hemos mencionado previamente, no está demás recordar lo siguiente:
Unidades estadísticas elementales - Población: Conjunto total de sujetos sobre los cuales se quiere investigar. Ejemplo: todos los estudiantes activos del TEC en el año 2013.
- Muestra: Subconjunto de la población en el cual se recoge información. Ejemplo: mil estudiantes activos del TEC en el año 2013, seleccionados al azar.
Fig 3. Población vs Muestra
17
Estadística descriptiva versus estadística inferencial - Estadística Descriptiva: Conjunto de técnicas matemáticas que nos permiten describir el comportamiento de una o más variables en una muestra (y en algunos casos en una población). Ejemplo: Porcentajes de intención de voto para cada partido en una elección.
- Estadística Inferencial: Conjunto de técnicas matemáticas que nos permiten establecer generalizaciones en la población, a partir de los datos de una muestra. Ejemplo: Predicción del resultado final de una elección.
Para recordar siempre, la estadística descriptiva... DESCRIBE suena redundante pero así es, y la inferencial CONCLUYE. Revise los conceptos más desarrollados de ellas dos.
18
Estad铆stica Descriptiva Definici贸n y elementos El objetivo es reunir, representar y resumir de manera sistem谩tica los valores cuantificables referentes al comportamiento de un determinado problema o fen贸meno estudiado.
19
Estadísticas descriptivas: Nota Final Curso Metrología II Semestre 2012 (salida real de Minitab) Variable
Género
Nota
Hombre
Final
Conteo
Media
Desv.Est.
Mínimo
Q1
Mediana
Q3
14
77,50
6,43
65,00
75,00
75,00
81,25
Mujer
22
79,09
4,79
65,00
78,75
80,00
80,00
Variable
Género
Máximo
Nota
Hombre
90,00
Final
Mujer
85,00
total
- ¿Por qué describe? Porque “dice” en este ejemplo como son las calificaciones de los hombres porcentajes de notas, desviaciones, entre otra información. - Los hombres tienen calificaciones inferiores en comparación con las mujeres y mayor dispersión. - El 75% de las notas estuvieron entre 81,25 (hombres) y 80 (mujeres) o menor (Quartil 3).
20
Una herramienta muy importante para poder empezar a describir es la Distribución de frecuencias, que en esencia es un ordenamiento de un grupo de datos en clases o intervalos
Distribución de frecuencias Es un resumen de datos más compacto que un diagrama de tallo y hoja. El rango de datos debe dividirse en intervalos (intervalos de clase o celdas). El ancho de los intervalos debe ser del mismo tamaño (reforzar información visual). Entre 5 y 20 intervalos son satisfactorios; √n puede dar buenos resultados para saber cuántos intervalos se pueden realizar. Se redondea al n siguiente.
21
Distribución de datos agrupados El objetivo es resumir la información y por lo general cuando se trata de grupos de gran tamaño (mayor a 20 elementos), que se deben agrupar, es decir, ordenar, clasificar y presentarlos en una tabla de frecuencias. Se debe verificar que la información esté repetida (frecuencia), sí esto no ocurre no se puede hacer una distribución de frecuencias, también se debe verificar y que se puedan clasificar los datos. La agrupación puede ser simple gracias a los intervalos de clase que se le definan. Más adelante es ésta presentación en el ejemplo 1 puede apreciar la forma visual de una distribución de frecuencias. Para poder hacer una distribución de frecuencia, es importante reconocer que los datos se repiten, de lo contrario, no tendría sentido.
22
Distribución de datos no agrupados Los datos están en “bruto”, tal y como se recolectaron (es decir, no hay clasificación previa). No tiene sentido clasificarlos ni generar tablas sobre todo por el tamaño del grupo (por ejemplo: 7 provincias de Costa Rica). Se verifica que la información no se repita ya que no se puede clasificar ni resumir en una tabla de frecuencias.
En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos, procedemos a clasificarlos (si es posible, ya que también debemos de buscar la lógica al clasificar los elementos) para convertirlos en “datos agrupados”.
Ejemplo de Datos no agrupados (datos en bruto)
Edad de 20 niños
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6
23
Pasos para agrupamiento de datos (Procedimiento) 1- Calcular el nĂşmero apropiado de intervalos K usando una de las siguientes reglas (por experiencia entre 5 y 20 clases): K= 1+3,3log10(n) Regla de Sturges Ăł K= â&#x2C6;&#x161;n (este se recomienda n < = 50) 2- Calcule la diferencia entre el valor mĂĄs grande y el mĂĄs pequeĂąo de los datos. Esta diferencia se llama rango. R= đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x17D;đ?&#x2018;Ľ â&#x2C6;&#x2019; đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x2013;đ?&#x2018;&#x203A; 3- Calcular la amplitud o anchura de clase, C = R/K. 4- Calcule el nuevo rango (NR), redondeando la amplitud de case C a la cantidad entera mĂĄs prĂłxima con â&#x20AC;&#x153;n-1â&#x20AC;? decimales, si C tiene â&#x20AC;&#x153;nâ&#x20AC;? decimales; y multiplicar esta cantidad redondeada por el nĂşmero de intervalos encontrados en el paso 1. 5- Calcule los lĂmites inferior y superior de la primera y Ăşltima clase de la distribuciĂłn, de la siguiente forma: ObservaciĂłn menor = đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x2013;đ?&#x2018;&#x203A; â&#x20AC;&#x201C; (NR - rango) / 2 ObservaciĂłn mayor = đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x17D;đ?&#x2018;Ľ + (NR - rango) / 2 6- Construir la distribuciĂłn de frecuencias.
24
Ejemplo 1 (Tiempos de atenciĂłn en cajas en minutos)
5
2
9
8
1
7
9
9
8
9
7
6
4
5
9
4
1
3
3
3
5
6
2
1
4
6
6
8
3
6
1- Calcular el nĂşmero apropiado de intervalos K usando una de las siguientes reglas: n= 30
K= 1+3,3log10(30) o K= V30
K= 5,87 ~ 6
2- Calcular el nĂşmero apropiado de intervalos K usando una de las siguientes reglas: R = đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x17D;đ?&#x2018;Ľ â&#x20AC;&#x201C; đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x2013;đ?&#x2018;&#x203A;
R= 9 â&#x20AC;&#x201C; 1 = 8
3- Calcular la amplitud o anchura de clase C = Rango / K
C=8/6
C = 1,33 (ancho que tendrĂĄ la
clase o intervalo)
25
4- Calcule el nuevo rango (NR), redondeando la amplitud de clase C a la cantidad entera mĂĄs prĂłxima con â&#x20AC;&#x153;n-1â&#x20AC;? decimales, si C tiene â&#x20AC;&#x153;nâ&#x20AC;? decimales, y multiplicar esta cantidad redondeada por el nĂşmero de intervalos encontrados en el paso 1. C = 1,5 C tiene dos decimales por lo tanto se aplica â&#x20AC;&#x153;n-1â&#x20AC;? y como C original tiene 2 decimales de ahĂ que quede en uno y a la cantidad entera mĂĄs prĂłxima. NR = 1,5 * 6 ------- NR = 9 (Nuevo Rango) 5- Calcule los lĂmites inferior y superior de la primera y Ăşltima clase de la distribuciĂłn, de la siguiente forma: ObservaciĂłn menor = đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x2013;đ?&#x2018;&#x203A; â&#x20AC;&#x201C; (NR - rango) / 2 = 1- (9 - 8) / 2 -----> 0,50 ObservaciĂłn mayor = đ?&#x2018;&#x2039;đ?&#x2018;&#x161;đ?&#x2018;&#x17D;đ?&#x2018;Ľ â&#x20AC;&#x201C; (NR - rango) / 2) = 9 + (9 - 8) / 2 -----> 9,50 6- Construir la distribuciĂłn de frecuencias (hacer la tabla)
26
Ejemplo 1 (Tiempos de atención en cajas en minutos) Distribución de Frecuencias Límite
Límite
inferior
superior
0,5
2
2,0
Marca de clase
Frecuencia
Gráfica de
Frecuencia
conteo
Absoluta
1,25
/////
5
0,16666667
0,16666667
3,5
2,75
/////
4
0,13333333
0,3
3,5
5,0
4,25
/////
6
0,2
0,5
5,0
6,5
5,75
/////
5
0,16666667
0,66666666
6,5
8,0
7,25
/////
5
0,16666667
7
8,0
9,5
8,75
/////
5
0,16666667
0,83333333
TOTAL
30
(punto medio del intervalo)
Relativa (en % o decimales)
Frecuencia Acumulada
1
27
Ejercicio 1 (libro Probabilidad y Estadística: Un enfoque teórico y práctico, 2da edición)
En una muestra aleatoria de 500 valores se obtuvo un valor máximo de 190 y un valor mínimo de 80. Sí se le pide que sugiera intervalos de clase para agrupar estos 500 valores ¿Cuántos intervalos sugiere? (Favor resolver a manera de práctica)
Tiempo estimado (10 minutos)
28
Ejercicio 2 (libro Probabilidad y Estadística: Un enfoque teórico y práctico, 2da edición)
En una encuesta de hogares se obtuvieron los siguientes datos.
Número de miembros por familia
Número de familias
1
1600
2
2700
3
1900
4
1400
5
800
6 ó más
550
Se pide determinar: a- Las frecuencias relativa y absolutas b- Las frecuencias acumuladas c- Dibujar la distribución de frecuencias correspondiente 29
sobre las velocidades en kilómetros por hora de
Ejercicio 3
105 automóviles que pasaron por el puesto de
(libro Probabilidad y Estadística: Un enfoque teórico
radar situado en una carretera de alto tráfico de
y práctico, 2da edición)
vehículos.
Supóngase que los siguientes datos corresponden a los registros que un policía de tránsito anotó
Velocidades en kilómetros por hora 69
87
65
91
68
61
74
48
66
47
59
111
55
40
82
52
67
86
77
84
80
69
62
91
64
60
70
81
56
80
72
57
92
54
70
51
80
69
67
90
98
59
86
62
69
96
78
103
89
83
101
89
65
95
89
65
78
72
55
77
57
100
75
53
64
42
67
70
81
50
75
68
65
46
93
71
72
83
78
59
80
71
55
54
104
81
73
85
53
87
74
75
77
84
62
79
79
75
78
70
77
59
80
79
63
a- Construir la distribución de frecuencias correspondiente
30
Gráfico de frecuencias Lo anterior visto es la forma de hacer una distribución de frecuencias que en realidad es un acomodo tabular de los datos. Ahora es importante gráficamente poder observar dicho acomodo. Gráficos de barras Utilice esta opción para comparar alguna medida de categorías de datos. Cada barra puede representar un conteo de una categoría, una función de una categoría (como la media, suma o desviación estándar) o valores de resumen de una tabla. El ancho de las barras ya sea horizontal o vertical es del mismo grosor. Las figuras siguientes Fig 4. Gráfico de barras
muestran ejemplo de gráficas generadas desde Minitab.
31
Grรกficas generadas desde Minitab
Fig 5. Grรกfico de barras
32
Fig 6. Grรกfico de barras
33
Gráfico de bastones Es un gráfico similar a los anteriores, lo que grafica son líneas pero a partir de los puntos medios del intervalo de clase que se ha definido. Se utiliza para variables cuantitativas discretas y toma pocos valores diferentes.
Fig 7. Gráfico de bastones
34
Histogramas Gráfica utilizada para evaluar la forma y dispersión de datos de muestra continuos. Proporciona una impresión visual de la forma que asume la distribución de las mediciones, así como información acerca de la separación o dispersión de los datos. Cuando el tamaño de la muestra es grande, el histograma puede proporcionar un indicador confiable de la forma general de la población de mediciones. Ejemplo: Resistencia a la comprensión de 80 ejemplares de prueba de una aleación aluminio-litio.
Fig 8. Histogramas
35
PolĂgonos Tiene como base la marca de clase del intervalo (đ?&#x2018;&#x2039;đ?&#x2018;&#x2013; ) y como altura la frecuencia absoluta respectiva (đ?&#x2018;&#x201C;đ?&#x2018;&#x2013; ). Se cierra el polĂgono extendiendo la amplitud del intervalo en ambos lados. Al lado izquierdo restando a la marca de clase inicial el ancho de clase y al lado derecho agregando a la marca de clase final el ancho de clase.
PolĂgono de frecuencias Intervalos
Xi (Marca de Clase)
fi N de
Edades
Edad Promedio
consumidores
[12-17 >
14.5
12
[17-22 >
19.5
6
[22- 27 >
24.5
5
[27- 32 >
29.5
9
[32- 37 >
34.5
8
[37- 42 >
39.5
6
[42- 47 >
44.5
4
36
Fig 9. PolĂgono de Frecuencias
37
GrĂĄficos hoja y tallo Es una forma adecuada de obtener una representaciĂłn visual informativa de un conjunto de datos đ?&#x2018;Ľ â&#x2020;&#x201C; 1, đ?&#x2018;Ľ â&#x2020;&#x201C; 2, đ?&#x2018;Ľ â&#x2020;&#x201C; 3, â&#x20AC;Ś , đ?&#x2018;Ľ â&#x2020;&#x201C; đ?&#x2018;&#x203A; donde al menos cada đ?&#x2018;Ľ â&#x2020;&#x201C; đ?&#x2018;&#x2013; tiene dos dĂgitos: un tallo y una hoja.
Se deben elegir pocos tallos en comparaciĂłn con las observaciones (520). Una vez elegido el conjunto de tallos, se enlistan en el margen izquierdo y se van asociando las hojas correspondientes a los valores de los datos.
Una excelente forma de hacerlo es en Minitab ya que lo podrĂĄ visualizar de una forma mĂĄs clara. Los datos se pueden dividir en cuatro partes (cuartiles)
38
Ejemplo Diagrama Tallo-Hoja. Minitab
Resistencia 105 121 186 143 221 181 183 180 97
120 174 141 154 168 153 167
245 181 199 110 228 158 174 176 163 160 115 133 131 208 154 158 207 194 193 123 180 133 190 156 134 184 167 146 178 135 76
229
218 165 171 169 157 172 101 158 199 145 163 158 151 171 142 148 160 160 87
135 175 237 149 150
196 150 176 149 201 170 200 118
39
Ejemplo Diagrama Tallo-Hoja. Datos de Resistencia El número 10 entre paréntesis marca dónde está la mediada de los datos Tallo y hoja de Resistencia N = 80 Unidad de hoja = 1,0 LO 76.87 3
9
7
5
10
15
8
11
058
11
12
013
17
13
133455
25
14
12356899
37
15
001344678888
(10)
16
0003357789
33
17
0112445668
23
18
0011346
16
19
034699
Si usted se pone creativo y trata
10
20
0178
de imaginariamente visualizarlo
6
21
8
5
22
189
HI
237.245
y voltearlo, verá que es una distribución de frecuencias
40
Gráficos de caja Resumen en forma de gráfica de la distribución de una muestra que exhibe su forma, tendencia central y sobre todo la variabilidad. La presentación predeterminada de las gráficas de caja se compone de los siguientes elementos: Elemento
Definición
Valor atípico (1)
Observación que se encuentra más allá del bigote o inferior
Bigote superior (2)
Se extiende hasta el máximo punto de datos dentro de alturas de caja de 1.5 desde la parte superior de la caja
Caja de rango
Línea superior: Q3 (tercer cuartil) 75% de los datos
intercuartil: 50%
es menor que o igual a este valor.
intermedio de los
Línea media: Q2(mediana) 50% de los datos es
datos (3)
menor que o igual a este valor. Línea inferior: Q1 (primer cuartil) 25% de los datos es menor que o igual a este valor.
Bigote inferior (4)
Se extiende hasta el punto de datos mínimo dentro de alturas de cada de 1.5 desde la parte inferior de la caja
41
Las gráficas de caja pueden ayudarle a comprender su distribución. Por ejemplo, la gráfica de caja de arriba representa los valores de tiempo en los cuales los clientes son colocados en espera durante sus llamadas al departamento de atención al cliente. El valor atípico en el extremo superior y el bigote superior más largo y la parte superior de la caja indican una asimetría positiva, lo cual tiene sentido, porque en el extremo inferior de la distribución ninguno de los tiempo de espera puede ser menor que cero.
Las gráficas de caja también son útiles para comparar varias distribuciones de datos. Por ejemplo, un ingeniero especialista en calidad compara el diámetro de tubos de plástico producidos semanalmente en el transcurso de tres semanas. La gráfica de caja de la figura 10 representa los resultados.
Las medianas de las tres semanas son similares. Sin embargo, las gráficas de caja muestran una tendencia a que se produzcan tubos de mayor diámetro en el transcurso del tiempo.
42
Las grรกficas de caja muestran cajas de rango intercuartil por opciรณn predeterminada en minitab, pero para algunas grรกficas de caja usted puede elegir mostrar un tipo de caja diferente
Fig 10. Grรกficos de caja
43
Bueno con esto se finaliza la primera clase, es importante que siempre piense en:
¿Hoy que aprendí...?
¿Hoy que recordé...?
Hoy qué quiero cambiar para ser mejor para ser mejor profesor.
Con esto a manera de resumen usted pude ver qué aspectos debe mejorar o reforzar en el estudio de ésta primera sesión. Si tiene alguna duda, inquietud o comentario, no dude en dirigirse a su profesor y con toda libertad preguntar lo que considere a bien para aclarar cualquier duda que el material le haya causado. También toda retroalimentación para mejora será muy bien recibida
44
Referencias
Moya, M. y Robles,N. (2010). Probabilidad y Estad铆stica: Un Enfoque te贸rico y pr谩ctico. Cartago: Tecnol贸gico de Costa Rica.
45