METODOS PARA LA OPTIMIZACION DE LAS PEQUEÑAS INDUSTRIAS Y/O EMPRESAS
RECOPILACION DE DATOS E INTERPRETACION ESTADISTICA
DIEGO F. GRANJA RUALES M.h.Sc.
1997
IMPORTANCIA DE LA RECOPILACION DE DATOS Dentro del análisis de optimización de las industrias, esta en saber con que es lo que se cuenta, para con ello apuntar todas las fuerzas de desarrollo y productividad que tiene la empresa y diseña las metas y objetivos a alcanzar. La recopilación de datos se lo realiza siempre con la ayuda de encuestas que son cuestionarios y/o inspecciones que determinan las necesidades o los problemas que tiene la fabrica en relación directa con sus productos sean estos los humanos y los materiales. Las encuestas o inspecciones nos ayudan a determinar los factores primordiales de la producción como son ambiente, trabajo y motivación, por ello es indispensable conocer que es lo que necesitan nuestros obreros, averiguar que harían en caso de ser directivos, etc. También a través de las encuestas se puede determinar que es lo que piensa y desearía nuestros clientes sobre el productos que entrega nuestra empresa.
2
RECOPILACION DE DATOS La recopilación de datos estadísticos se realiza en forma interna y externa. Los datos internos son obtenidos dentro de la organización encargada de efectuar un estudio estadístico, la misma que se encuentra la misma empresa en los varios departamentos. Así por ejemplo el Departamento de ventas, puede conservar los factores de ventas, el Departamento de personal, puede conservar los registros individuales de los empleados; el Departamento. De producción puede conservar los registros diarios concernientes a la cantidad de materia prima, mano de obra y gastos de fabricación. Sin embargo, los tipos más comunes de registros que son conservados en la mayoría de las empresas y que pueden ser empleados para un estudio estadístico son los registros contables (Balances y Estados financieros). Los datos externos pueden ser obtenidos de publicaciones o recopilaciones mediante encuestas o investigaciones de “campo”. Esto determina la importancia de conocer previamente la fuente o lugar en donde se encuentra la información requerida para nuestro estudio, la misma que puede ser de fuentes primarias o fuentes secundarias. Una fuente de datos se llama primaria cuando los datos se obtienen del recopilador original de los datos, cuando la información sale de su origen. Fuente secundaria se llama cuando los datos son obtenidos de una tercera persona, por una organización distinta al recopilador original. 1) ELABORACION DE ENCUESTAS Cuando los registros internos y los datos publicaciones disponibles no son apropiados para un estudio particular, una encuesta de datos originales tiene que ser llevada a cabo para satisfacer las necesidades. El trabajo de elaborar una encuesta es generalmente limitado por el tiempo, dinero y personal disponible para el estudio cuando se trata de cubrir toda una población. Pero, en lugar de recopilar información completa es preferible recoger dicha información, mediante una 3
muestra, la misma que significa una parte representativa de la población. La recopilación de datos sea de una Muestra o una población se realiza mediante encuestas, es decir, métodos comunes de recopilación que no consisten sino en realizar observaciones directas y formulación de preguntas. 1.1. - OBSERVACION DIRECTA: Pueden dar información exacta y es usualmente preferida, ya que puede ser empleada efectiva y económicamente. Sin embargo, esta limitado a unos pocos tipos de estudio y es a menudo demasiados inconvenientes en observaciones reales de ciertas operaciones por ejemplo, si deseamos conocer el ingreso recibido en una semana si un grupo de choferes de automóviles de alquiler, será muy inconveniente observarles a ellos, seria mas practico y fácil obtener los resultados realizando ciertas preguntas. Existen tres formas de hacer preguntas a fin de recopilar datos originales. A) Entrevistas personales b) Por teléfono y, c) Cuestionario enviado por correo 1.1.1 ENTREVISTAS PERSONALES: Resultan usualmente respuestas inmediatas de la persona que es interrogada. Este método también resulta en respuestas más exactas, puesto que el contacto personal durante una entrevista proporciona una oportunidad para explicar algunos puntos, los cuales no están claramente formulamos. Este método se suele llamar como CENSO. 1.1.2. CUESTIONARIO POR CORREO: Tiene la ventaja principal de ahorrar dinero y personal y de cubrir una mayor área geográfica. El costo de enviar un grupo de cartas es mucho más barato que el de enviar personas para hacer entrevista personales. Cuando las fuentes de datos están dispersas sobre una gran área, el método indicado pueden ser el mejor en términos de conveniencia, así como de economía.
4
1.1.3. PREGUNTAS POR TELEFONO: Ha sido usado en forma creciente en la realización de algunos estudios simples dentro de una localidad. La ventaja principal de este método es que en investigación se puede contratar un pequeño numero de telefonistas a bajo costo y pueden llegar a un grupo de gentes dentro de un corto periodo de tiempo, sin embargo, los tenedores de teléfonos o no son un numero representativo de la población en general. Además, solamente una pequeña cantidad de información puede ser obtenida a través de conversación telefónica o por fax. 1.2. DISEÑO DE CUESTIONARIOS: Para notar la diferencia entre los métodos de formular preguntas, se debe observar ciertos puntos, los cuales son importantes al diseñar un cuestionario empleado; los siguiente puntos deben considerarse para diseñar un cuestionario: a) El número de preguntas debe ser mínimo b) Las preguntas deben ser breves y claras c) Se debe evitarse preguntas ofensivas D) No se deben usar preguntas que induzcan respuestas. C) Las preguntas deberán ser fáciles de contestar. F) Las preguntas deberán requerir contestaciones simples. Antes de principiar una encuesta de gran alcance, una buena practica es probar un cuestionario provisional con un pequeño grupo de personas que sean representativas de la población a ser encuestada. La preprueba dará oportunidad para descubrir cualquier omisión en el borrador, para mejorar la forma final de los cuestionarios y para ganar alguna experiencia valiosa en técnicas de entrevistas, de esta manera, puede obtenerse mejores resultados sobre el estudio.
5
2) ORGANIZACIÓN DE DATOS Cuando los datos han sido recopilados es necesario que estos sean organizados para dar mejor utilización de los mismos. La organización incluye tres partes principales: Conexión, clasificación y Tabulación de datos recopilados. 2.1. CONECCION: El trabajo de conexión de datos recopilados de registros internos y fuentes publicadas es relativamente simple. Sin embargo, los datos recopilados de una encuesta puedan necesitar conexión extensiva. La persona quien revise los datos puede encontrar frecuentemente los siguientes defectos en los resultados de una encuesta: a) Respuestas son inconsistentes b) Los éxitos no son determinables c) Las respuestas son incompletas d) Se requiere cálculos 2.2. CLASIFICACION: Existen muchas formas de clasificar datos estadísticos, pues estos pueden ser determinadas de acuerdo a cuatro fases: tiempo, lugar, cantidad y cualidad. 2.3. TABULACION: Los principales métodos de tabulación son: a) Tarjetas de escritura manual, que es comúnmente usado al tabular hechos simples que pueden ser escritos en una tarjeta para cada caso o informante. B) Hoja de registro que proporcione espacio para clasificaciones, marcas, totalidad y el número de marcas. C) Tarjetas de perforación, aquellas que tienen agujeros alrededor de las orillas. Una muesca es cortada en cada tarjeta a través del agujero arriba del número que representa el hecho a ser clasificado de otros hechos, pues una varilla y usada al clasificar las tarjetas. D) Tarjetas perforadas, que básicamente involucra dos tipos de facilidades, las tarjetas y las maquinas usadas para operar las tarjetas. Una tarjeta IBM tiene 80 columnas, etc. 6
E) Un sistema de procesamiento electrรณnico de datos, a menudo simplemente llamado sistema de computaciรณn, bรกsicamente consiste de una combinaciรณn de cuatro unidades de funcionales: ENTRADA o (LECTORA) MEMORIA CENTRAL DE PROCESAMIENTO Y SALIDA.
7
3)- REPRESENTACION DE DATOS En general existen tres formas de presentar los datos recopilados y organizados: a) Presentación con palabras b) Tablas estadísticas c) Gráficos estadísticos 3.1. PRESENTACION CON PALABRAS Cuando una serie de datos incluye solamente unas pocas observaciones, la palabra escrita puede ser usada para presentar, apropiadamente los hechos, o sea cuando existen pocas observaciones y la variable toma pocos valores distintos. En este tipo de estadísticas, los datos se presentan como se van obteniendo, sin embargo cuando un gran numero de datos esta siendo presentado, la presentación con palabra escrita se vuelve insuficiente y pesado, en este caso tablas y gráficas estadísticas son preferidas. 3.2. TABLAS ESTADISTICAS Cuando los datos estadísticos se presentan en forma de tablas, los datos son arreglados sistemáticamente en columnas o hileras, o sea cuando existen muchas observaciones y la variable forma pocos o muchos valores distintos, esto mediante tablas de distribución de frecuencia con o sin intervalos, por ejemplo la distribución de edades de 50 empleados de una fabrica X.
Edad (años) 25 26 27 28 29 30
No. Empleados 15 5 11 9 3 7 50 8
3.3) GRAFICOS ESTADISTICOS: Un diagrama estadístico o gráfico es un medio plástico para presentar datos estadísticos. Se construye usualmente de acuerdo con la información proporcionada en una tabla. Una gran variedad de gráfica ha sido usada en estudios estadísticos para presentar datos o para mostrar las relaciones entre varios grupos de datos. 3.3.1) TIPOS MÁS COMUNES DE GRAFICOS 3.3.1.1) GRAFICA DE LINEA: Que consiste de líneas o segmentos de líneas rectas, también llamadas curvas o poligonales. Estas gráficas son principalmente usadas para mostrar datos clasificados por cantidad o tiempo. Ejemplo. Ingresos anuales de la empresa X 1995 a 1997 Año 1995 1996 1997
Ventas 50.000.000 100.000.000 200.000.000
FUENTE: Datos hipotéticos Gráficas de línea
9
250000 200000 150000 100000 50000 0 1995
1996
1997
3.3.1.2. GRAFICAS DE BARRAS.- Las mismas que están compuestas de barras rectangulares. La anchura de cada barra es usualmente igual a la de los otros. La longitud de cada barra muestra los datos representados. Estas gráficas son efectivas para enfatizar unos pocos ITEMS de uno o dos series de datos, mientras que las gráficas de línea son preferibles para presentar muchos ítems en una o varias series de datos. Las barras en una gráfica de barras pueden ser arregladas de manera vertical u horizontal, dependiendo de la preferencia artística de quien la construya.
10
Ejemplo de barras verticales Galones Combustibles 300
250
200
150
100
50
0 1986
1987
1988
1989
1990
1991
11
Ejemplo de Barras Horizontales Miles de toneladas netas
Ecuador U.S.A Canada Alem ania Japon 0
200
400
600
800
1000
1200
1400
3.3.1.3. GRAFICAS DE DIMENSIONES: Son aquellos que se utilizan mediante superficie o volúmenes los tipos comunes de estas gráficas son cuadros, rectángulos y círculos. A) Gráficos de cuadros: 2000
16.000
1985
1990
No. De empleados de Machine Cia. B) Gráfico de círculos 12
ECUADOR 10.256.000 4.826.52,9 Habitantes Costa 619.764,7 Sierra 1.206.588.2 Oriente 603.294,12 Galápagos 4. ANALISIS ESTADISTICO: Después de que los datos estadísticos son recopilados, organizados y presentados en forma de fácil lectura (interpretación) principalmente en tablas estadísticas, estos están listos para ser analizados. Los valores incluidos en un grupo de datos usualmente varían en magnitud, algunos de ellos son pequeños y otros son grandes. Un promedio es un VALOR SIMPLE, el cual es considerado como el VALOR MÁS REPRESENTATIVO O TIPICOS para un grupo de números. Obviamente, el valor más representativo para un grupo de números normalmente no es el valor más pequeño ni el más grande, sino es un numero cuyo valor esta en algún punto intermedio del grupo. Así un promedio que es frecuentemente referido como una media de tendencia central. EL PROMEDIO, se emplea con frecuencia como mecanismo para resumir un conjunto de cantidades o números sobre todo si es grande, a fin de describir los datos estadísticos como ejemplo cabe citar la edad 13
promedio de los trabajadores de la fabrica X, el salario semanal promedio de trabajadores manufactureros de una empresa, y el ingreso familiar promedio de una nación. Los promedios son también usados frecuentemente para comparar un grupo de datos como otro. Los promedios más comunes conocidos en estadística son: a) La media aritmética b) La mediana c) La moda d) La media geométrica Cada promedio tiene sus características particulares y la determinación de cual de los diferentes promedios deberá ser usado bajo diferentes circunstancias depende grandemente de las características de los promedios. En general, los tres primeros promedios son usados mas frecuentemente. 4.1. MEDIDAS DE TENDENCIA CENTRAL Estas medidas indican el valor central o promedio de todos los datos. Estos valores provienen de una población homogénea y que la misma debe ser representativa. 4.1.1. MEDIA ARITMETICA: Simplemente media o promedio, se simboliza con la letra X mayúscula y una barra segmento. X. La media aritmética totaliza los valores de todos los datos en una suma y los divide para el numero de datos tabulados. Ejemplo: Altura en cm de 4 plantas 45, 30, 27, 32 = 134/4 = 33.5 X = 45+30+27+32 = 134 4 4
X = 33.5 cm/planta
La X de un conjunto de observaciones: 14
X1, X2, X + ...............+ Xn esta definida de la siguiente forma matemáticas: n X = X1 + X2 + X3 ........1 Xn = Xi n i =1 n 4.1.2. MEDIA ARITMETICA PONDERADA: Además de contar con la observación elemental, cuenta con una información adicional. Dado un conjunto de observaciones: X1, X2, X3 .............Xn y un grupo de valores P1, P2, P3............. Pn, Asociadas con cada observación que se les conoce con el nombre de peros o ponderaciones, la media aritmética ponderada que define de la siguiente forma matemática. n Xp = X1P1 + X2P2 ........ + Xn Pn X IPI P1 + P2 .........+ Pn i=1 pi Ejemplo: El salario promedio por hora de un grupo de obreros es la siguiente: Salario hora/sucres
No. Obreros f
4-8 8-12 12-16 16-20 20-24
3 12 40 47 32 134
Marca de clase 6 10 14 18 22
Xif 18 120 520 846 704 2248
Xp = 2248 = 16,78 promedio salarios u hora sucres. 134
15
Ejemplo: Se ha preguntado a 50 familias el numero de personas activas, los resultados son los siguientes: Personas Activas (Variable) 5 10 4 6
No. De familias
Xif f 16 20 9 5 (50) n
80 200 36 30 (346) Xif
Xp = 346 = 6,92 personas activas por familia 50 Xp = (Xif) n 4.1.2.1. PROPIEDADES DE LA MEDIA ARITMETICA La suma algebraica de las desviaciones de un grupo de datos desde su media es igual a cero. Ejemplo: La edad de cinco personas expresadas en edades: 50, 40, 35, 30, 45 Xi - X la desviación es la diferencia entre cada observación y la media aritmética. Xi 50 40 35 30 45 X = 200/5=40
X 40
Xi-X 10 0 -5 -10 5 =0 16
4.1.3. MEDIANA: La mediana de 1 grupo de datos ordenados en forma ascendente o descendente es el valor que ocupa el LUGAR CENTRAL, si la serie de datos tiene un número IMPAR y la media aritmética de los 2 valores centrales si la serie tiene un número PAR de datos. Ejemplo: a) Averiguar la mediana de los datos obtenidos en la inspección de control de calidad, de las latas de mermelada rechazadas: 3, 12, 5, 6, 4, 7, 2 2, 3, 4, 5, 6, 7, 12 Número Impar Mediana = Me = 5 b) De igual manera: 10, 4, 8, 3, 11, 9 3, 4, 8, 9, 10, 11 Números Par Me = 8+9 = 17/2 8,5 Me = 8.5 4.1.3.1. Cálculos para Mediana con 2 variables: a). Calcular la frecuencia acumulada b). Calcular N/2 C). Me = Li + N/2 - (fa-1) a i f donde: Li = Limite interior al intervalo correspondiente a la primera fa mayor que N/2 Fa-1 = Frecuencia acumulada anterior a la 1era frecuencia acumulada mayor que N/2 f= frecuencia ai = amplitud del intervalo 17
Ejemplo:
(ai)
Salarios No. Obreros 4-8 3 8-12 12 12-16 40 16-20 47 20-24 32 134
N/2 = 13d = 67 2
fa 3 15 55 102 134 Li = 16 fa-1 = 55 f = 47 ai = 4
Me = 16+134/2 - 55 4 = 16+55 4 47 47 Me = 17,02 Me = 17,02 salario /hora Me = 17,02 salario/hora 4.1.4. MODA (MODO): El modo de un grupo de datos o de observaciones es el valor que se repite con mayor frecuencia, es decir que puede no haber nada o esta no puede ser la única. Ejemplo: 3,4,5,3,2,4,3, Mo= 3 2,4,2,3,4,2,5,4, Mo= 2 y 4 4.1.4.1. DISTRIBUCION DEL MODO: La distribución se la realiza gráficamente, según el caso o numero de repeticiones, cuando existe una moda la distribución se denomina UNIMODAL, dos, dimodal, tres o más, multimodal. Ejemplo: 3,4,5,3,2,4,3 18
Mo = 3 Cada cúspide representa una Moda 20 18 16 14 12 10 8 6 4 2 0 2
3
4
1987
1988
5
300 250 200 150 100 50 0 1986
1989
1990
1991
4.2. MEDIDAS DE DISPERSIÓN O VARIACION 19
Estas medias están dadas cuando los valores o grados tienden a separarse a alejarse de un valor central. Las MD o V mas empleados en estadística son las siguientes: a) Rango (amplitud total) b) Desviación media c) Varianza d) Desviación típica e) Error standard f) Coeficiente de variación RANGO: La producción en la empresa X fue: 10-4-3-2-8-6 R = 10-2=8 El resto de MD o V se utilizan cuando las diferencias entre una medida o del valor central son casi mínimas, estas medidas se usan en estudios experimentales.
20