Procedimientos e interpretación de datos
“Guía de trabajos y actividades” Stephanie Villalobos García
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO PROGRAMA DE MAESTRÍA Y DOCTORADO EN ARQUITECTURA CAMPO DE CONOCIMIENTO: TECNOLOGÍAS 2021 Asesor: Mtro En Arq Arturo Valeriano Flores Junio 2021
contenido
1
El proceso de la investigación cuantitativa
5
Muestreo y variables
9
Resumen estadístico Media muestral Desviación estandar Datos atípicos Mediana muestral Moda y Rango Cuartiles Percentiles
15
Resumen gráfico Hoja y tallo Diagrama de puntos Histograma Diagrama de caja Datos multivariados
19
Correlación de variables Coeficiente de correlación
23
Recta de los mínimos cuadrados
27
Comparación de modelos Error medio cuadrático
29
Gráfica de residuos y valores ajustados
31
Bibliografía
Proceso de investigación La investigación según Sampieri (2013) se define como el conjunto de procesos sistemáticos, críticos y empíricos que se aplican al estudio de un fenómeno o problema con el objetivo de ampliar su conocimiento. Un tipo de método de investigación es el científico, el cual se refiere al conjunto de procedimientos que, valiéndose de los instrumentos o técnicas necesarias, examina y soluciona un problema o conjunto de problemas de investigación (Bernal, 2014); este método suele dividirse en: 1. Cualitativo: su prioridad es cualificar, describir e interpretar el fenómeno social a partir de rasgos determinados. 2. Cuantitativo o tradicional: se fundamenta en la medición y el análisis de las relaciones entre las variables estudiadas de forma deductiva; tiende a generalizar y normalizar resultados. La ruta cuantitativa de la investigación, representa un conjunto de procesos organizados de manera secuencial para comprobar ciertas suposiciones.
Fase 1 Idea
Fase 6 Desarrollo del diseño de investigación
1
Fase 2
Figura 1. Proceso cuantitativo. Fase 3 Fase 4
Planteamiento del problema
Revisión de la literatura y desarrollo del marco o perspectiva teórica
Fase 7
Fase 8
Definición y selección de la muestra
Recolección de los datos
Visualización del alcance del estudio
Fase 9 Análisis de los datos
Fase 5 Elaboración de hipótesis y definición de variables
Fase 10 Elaboración del reporte de resultados
Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri.
Cuantitativa
Figura 2. Enfoque cuantitativo. Características
a) Planteamientos específicos b) Orientado en variables medidas c) Prueba de hipótesis y teoria d) Diseños prestablecidos
Proceso
a) Secuencial b) Orientado a la realidad objetiva c) Deductivo d) Probatorio
e) Instrumentos estandarizados f) Datos númericos g) Análisis estadístico sobre una matriz
a) Representatividad y generalización de resultados b) Control sobre fenómenos y precisión c) Réplica d) Predicción
Fortalezas
Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri.
La investigación experimental según Bernal (2014) se realiza mediante los llamados diseños, que son un conjunto de procedimientos con los cuales se manipulan una o más variables independientes y se mide su efecto sobre una o más variables dependientes. En la ruta cuantitativa fijar una muestra representa un ahorro de tiempo y recursos. Una muetra es un subgrupo de la población o universo del cual se recolectan los datos y que debe ser representativo de esta, si se desean generalizar los resultados. Se clasifican en dos tipos: Muestra probabilística: subgrupo de la población en el que todos los elementos de esta tienen la misma posibilidad de ser elegidos. Muestra no probabilística: subgrupo de la población en la que la elección de los elementos no depende de la probabilidad sino de las características de la investigación. Figura 3. Representación de una muestra.
Población
Muestra
Fuente: Elaboración propia.
2
Procesamiento de datos La recolección de datos es la aplicación de uno o varios instrumentos de medición para recabar la información pertinente de las variables del estudio en la muestra. Los datos obtenidos son la base del análisis, si no se analizan los datos no hay investigación. Una vez obtenidos los datos, deberán seguir un proceso.
Organización
Dar un orden a la información obtenida con abase en las categorías identificadas según sus propiedades y dimensiones. Se pueden encontrar valores de carácter cuantitátivo o cualitativo.
Codificación
Codificar los datos significa asignarles un valor número o símbolo que los represente. Es decir, a las categorías de cada variable se les asigna un valor númerico o signo que tiene un significado.
3
Análisis e Interpretación
Cuadro de dos o más dimensiones y cada dimensión contiene una variable. A su vez, cada variable se puede subdividir en dos o más categorías
Los datos se interpretan en relación con las suposiciones o predicciones iniciales y de estudios previos. Se estabale una interpretación final, la cual constituye una explicación de cómo los resultados encajan en el conocimiento existente.
Elaboración de conclusiones
Tabulación
Procesamiento
Figura 4. Procesamiento de datos.
En este apartado se debe mostrar los aportes y las limitaciones de los resultados del estudio para la comprensión del problema estudiado. Señalar las excepciones o los aspectos no resueltos del problema de investigación en función de los objetivos y formular temas para futuras investigaciones que se deriven del análisis de sus resultados.
Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri y anotaciones de la materia Procedimientos e interpretación de datos.
Descripción general de la investigación Material biocompuesto a base de una matriz bio polimérica reforzada con agregados orgánicos para su uso en la construcción Resumen: Los biopolímeros tienen buenas propiedades mecánicas, plasticidad, biocompatibilidad, se procesan fácilmente y son un material prometedor para diversas aplicaciones de uso en compositos. Asimismo, las fibras vegetales se utilizan ampliamente en materiales poliméricos para mejorar las propiedades mecánicas, son bastante rígidas y se encuentran disponibles con facilidad en la naturaleza. Se está desarrollando un material biocompuesto a base de biopolímeros y aditivos orgánicos para obtener un sustituto del plástico como elemento arquitectónico. Mediante la búsqueda de resinas bioplásticas comerciales y su respectivo análisis para la prefactibilidad como material matriz, se propone combinarla con un residuo sólido agrícola como fase de refuerzo y transformarlo con ayuda de un sistema creado específicamente para la construcción del prototipo. Y como resultado: comprobar la aplicabilidad de materiales biodegradables y de origen renovable en la edificación, comparar sus propiedades mecánicas con materiales sintéticos similares y visualizar la viabilidad de los bioplásticos como sustitutos de los polímeros derivados del petróleo dentro de la industria de la construcción. Enfoque: Cuantitativo Tipo de investigación: Experimental ¿En qué cosiste mi investigación?: Desarrollo de un material biocompuesto para la construcción con la forma de tableros laminados para revestir muros interiores, columnas y muebles. Asimismo, serán útiles para bases de estructuras en pisos, plafones o carpinterías. ¿Qué tipo de datos voy a manejar?: Valores numerales Propiedades físicas y mecánicas del material: Densidad (kg/m3) Módulo de Young (GPa) Resistencia a la tracción (MPa) Fuerza de impacto (kJ/m2) Días de biodegradabilidad en compostaje Porcentaje de absorción de agua Porcentaje de agregado con relación a la matriz 4
Muestreo y variables
La estadística según Triola (2013) es la ciencia que se encarga de planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar e interpretar la información para extraer conclusiones basadas en los datos. La población es el conjunto completo de todos los elementos (puntuaciones, personas, mediciones, etcétera) que se someten a estudio. El conjunto es completo porque incluye a todos los sujetos que se estudiarán. La muestra es un subconjunto de miembros seleccionados de una población. En una muestra aleatoria los miembros de la población se seleccionan de forma que cada miembro individual tenga la misma posibilidad de ser elegido. Con el muestreo aleatorio esperamos que todos los componentes de la población estén representados (aproximadamente) de manera proporcional. Una muestra aleatoria simple de n sujetos se selecciona de manera que cada posible muestra del mismo tamaño n tenga la misma posibilidad de ser elegida. Es importante obtener datos muestrales que sean representativos de la población de la que se obtienen para obtener conclusiones acertadas. Por lo cual es importante considerar lo siguiente: • Los datos muestrales deben reunirse de una forma adecuada, como a través de un proceso de selección aleatoria. • Si los datos muestrales no se reúnen de forma adecuada, resultarán inútiles.
5
Los métodos estadísticos se rigen por los datos recabados. Por lo regular, obtenemos datos de dos fuentes distintas: los estudios observacionales y los experimentos. En un estudio observacional, vemos y medimos características específicas, pero no intentamos modificar a los sujetos que estamos estudiando. En un experimento aplicamos algunos tratamientos y luego procedemos a ob- servar sus efectos sobre los sujetos. Además de las muestras aleatorias y las muestras aleatorias simples, existen otras técnicas de muestreo, como: Muestreo sistemático: elegimos algún punto de partida y luego selecciona- mos cada k-ésimo (por ejemplo, cada quincuagésimo) elemento en la población. Muestreo de conveniencia: simplemente se utilizan resultados que sean muy fáciles de obtener. Muestreo estratificado: subdividimos a la población en al menos dos sub- grupos (o estratos) diferentes, de manera que los sujetos que pertenecen al mismo subgrupo compartan las mismas características (como el género o la categoría de edad), y luego obtenemos una muestra de cada subgrupo (o estrato). Muestreo por racimos o conglomerados: primero dividimos el área de la población en secciones (o conglomerados), luego elegimos al azar algunos de estos conglomerados, y después elegimos a todos los miembros de los conglomerados seleccionados. Un error de muestreo es la diferencia entre el resultado de una muestra y el verdadero resultado de la población; este error es consecuencia de las fluctuaciones por el azar. Tipos de datos Los datos cuantitativos (o numéricos) consisten en números que representan conteos o mediciones. Los datos categóricos (o cualitativos o de atributo) consisten en nombres o etiquetas que no son números y que, por lo tanto, no representan conteos ni mediciones.
6
Tipos de experimentos Experimentos de una muestra: Una población de la cual se toma una muestra. Experimentos de muestras múltiples: Dos o más poblaciones de interés y se toma una muestra de cada población. Experimentos factoriales: es un tipo de experimento diseñado que permite estudiar los efectos que varios factores pueden tener en una respuesta. Figura 5. Métodos de muestreo. 1
2
3
4
5
6
7
8
9
Muestra
Aleatoria simple
3
Conglomerado
Estratificado
Conveniencia
Sistemática
1
7
2
3
4
5
6
7
8
5
Muestra a cada 3
9
3
2 1
4 3
2 1
6 5
4 3
9
II I
4
6
9
9
Una muestra de cada grupo
IV III
6
Muestra escogida porque ninguna de sus caras está contaminada
8 7
7
4
II
Todas los lotes de bagazos Bagazo de caña de azúcar Se analizan todas las fibras Bagazo de Agave Tequilana en los lotes seleccionados Bagazo de Agave Angustilofia Haw al azar. Bagazo de Agave Marmorana
Fuente: Gráfico elaborado a partir del libro Estadística por Sampieri y anotaciones de la materia Procedimientos e interpretación de datos.
Definición general de variables Material biocompuesto a base de una matriz bio polimérica reforzada con agregados orgánicos para su uso en la construcción Se plantean las siguientes variables (ver Tabla 1), de las cuales habrá que considerar que por cada variable que se ponga a prueba se necesitará la realización de cinco probetas. Por lo anterior, en total se tendrán 60 probetas categorizadas según su proporción de agregado para hacer su respectiva comparación entre una muestra y otra. Tabla 1. Tabulación de variables.
1
Biodegradabilidad
2
Solubilidad
3
Intemperismo
4
Resistencia a la flexión
A
B
C
Biopolímero PLA
Biopolímero PLA con agregado al 20%
Biopolímero PLA con agregado al 40%
Total
Muestra 1A
Muestra 1B
Muestra 1C
15
Muestra 2A
Muestra 2B
Muestra 2C
15
Muestra 3A
Muestra 3B
Muestra 3C
15
Muestra 4A
Muestra 4B
Muestra 4C
15
Fuente: Elaboración propia.
8
Resumen estadístico
El resumen estadístico es el procedimiento con el cual se pueden obtener las características más evidentes de una muestra. Las medidas de tendencia central son los valores medios de la distribución de frecuencias y son útiles para ubicar los resultados de la muestra en la escala de medición de la variable en cuestión. Las medidas de tendencia central principales son: La media: puede definirse como el promedio aritmético de una distribución, donde la letra griega Σ (sigma mayúscula) indica que los valores de los datos deben sumarse, por lo que Σx representa la suma de todos los valores de los datos. El símbolo n expresa el tamaño de la muestra, que es el número de valores de datos.
La mediana: se puede considerar de manera general como un “valor medio” en el sentido de que aproximadamente la mitad de los valores en un conjunto de datos son menores y la mitad son mayores que la mediana. Para encontrar la mediana, primero ordene los valores (pón-galos en orden) y luego siga uno de los siguientes dos procedimientos: 1. Si el número de valores de datos es impar, la mediana es el número ubicado en el in-termedio exacto de la lista ordenada. 2. Si el número de valores de datos es par, la mediana se obtiene calculando la media de los dos números intermedios de la lista ordenada.
9
247 260 268 273 276 279 281 283 284 285 286 288 Mediana: Promedio del 6° y 7° lugar (279 + 281)/2 = 280
Media recortada: Debido a que la media es muy sensible a los valores extremos, se dice que no es una medida de tendencia central resistente. Al eliminar algunos valores bajos y altos, la media recortada se hace más resistente. Para encontrar la media recortada del P% para un conjunto de datos, primero ordene los datos, luego elimine el P% de los valores inferiores y el P% de los valores superiores, luego calcule la media de los valores restantes. 247 260 268 273 276 279 281 283 284 285 286 288 Media recortada 10%= 12 X 0.10 = 1.2 (260, 268, 273,...284,285,286)/12 = 231.25
Moda: es el (los) valor(es) que ocurre(n) con mayor frecuencia. No se utiliza mucho con datos cuantitativos, pero es la única medida de tendencia central que puede usarse con datos cualitativos (que consisten solamente en nombres, etiquetas o categorías). Si algunos valores tienen una frecuencia igual, cada uno representa una moda. Las medidas de la variabilidad indican la dispersión de los datos en la escala de medición de la variable en cuestión y responden a la pregunta sobre dónde están diseminadas las puntuaciones obtenidas para muestra o casos. Rango: también denominado recorrido, es la diferencia entre la puntuación superior y la puntuación inferior, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo. Por ejemplo, si en una muestra la persona mayor tiene 30 años y la menor 17, el rango será: 13. Figura 6. Media, Mediana, Moda. Media
Moda
Mediana Fuente: Gráfico elaborado a partir del libro Estadística por Sampieri.
10
La mitad del rango: es la medida de tendencia central que constituye el valor que se encuentra a la mitad, entre la puntuación más alta y la más baja, en el conjunto original de datos. Se calcula sumando el valor máximo con el valor mínimo y luego dividiendo la suma entre dos. La desviación estándar: o una varianza muestral de un conjunto de valores muestrales, denotada con s, es la medida de variación de los valores con respecto a la media. Las siguientes propiedades son consecuencia de la forma en que se define la desviación estándar: 1) La desviación estándar es una medida de variación de todos los valores con respecto a la media. 2) El valor de la desviación estándar s generalmente es positivo. Solo es igual a cero cuando todos los valores de los datos son el mismo número. (Nunca es negativa). Además, valores grandes de s implican mayores cantidades de variación. 3) El valor de la desviación estándar s puede aumentar de manera drástica con la inclusión de uno o más valores atípicos (valores de datos que se encuentran muy lejos de los demás). 4) Las unidades de la desviación estándar s (como minutos, pies, libras, etcétera) son las mismas de los datos originales. La varianza: de un conjunto de valores es una medida de variación igual al cuadrado de la desviación estándar.
11
Datos atípicos: puntos que son mucho más grandes o pequeños que el resto dentro de una muestra. Los datos atípicos se deben examinar siempre y cualquiera de ellos que se encuentre es resultado de un error que se debe corregir o eliminar. Un dato atípico se conserva y un error se elimina. Los percentiles y cuartiles son otras medidas de posición útiles para comparar valores dentro del mismo conjunto de datos o entre diferentes conjuntos de datos. Percentiles: son medidas de ubicación, expresadas como P1, P2, . . . , P99, que dividen un conjunto de datos en 100 grupos con aproximadamente el 1% de los valores en cada grupo. Los percentiles con frecuencia se usan para interpretar puntajes de exámenes estandarizados. Por ejemplo, si a una estudiante se le informa que su puntaje en un examen de ingreso a la universidad está en el 64avo. percentil, esto significa que 64% de los estudiantes que presentaron el examen obtuvo puntajes inferiores. El percentil 50, denominado P50, tiene aproximadamente el 50% de los valores de datos por debajo de él y aproximadamente el 50% de los valores de datos por encima de él, por lo que el percentil 50 es igual que la mediana. n = 12, encontrar percentil 65 (0.65)(13) = 8.45 8vo
9no
247 260 268 273 276 279 281 283 284 285 286 288 (283 + 284)/2 = 283.50
Cuartiles: son medidas de ubicación, denominadas Q1, Q2 y Q3, que dividen un conjunto de datos en cuatro grupos con aproximadamente el 25% de los valores en cada uno. Q1 (Primer cuartil): mismo valor que P25. Separa el 25% de los valores inferiores ordenados del 75% superior. (Para ser más precisos, al menos 25% de los valores ordenados son menores o iguales a Q1, y al menos 75% de los valores son mayores o iguales a Q1). Q2 (Segundo cuartil): igual a P50 e igual a la mediana. Separa el 50% de los valores inferiores ordenados del 50% superior. Q3 (Tercer cuartil): igual a P75. Separa el 75% de los valores inferiores ordenados del 25% superior. (Para ser más precisos, al menos 75% de los valores ordenados son menores o iguales a Q3 y al menos 25% de los valores son mayores o iguales a Q3). n = 12, encontrar 1Q o Primer Cuartil (0.25)(13) = 3.25 3ro
4to
247 260 268 273 276 279 281 283 284 285 286 288 (268 + 273)/2 = 270.5
12
Ejemplo aplicado de Resumen Estadístico De la tesis titulada “Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA”, por los autores, Abel Gire Quispe y Alexander Giovani Caceres Lupaca, se realizaron las mediciones de tres diferentes lotes de muestras de diámetros de la fibra Stipa Ichu, del primer lote de muestra se obtuvieron los siguientes datos: Stipa Ichu (mm) # Muestra 1 1 0.556 2 0.54 3 0.501 4 0.469 5 0.453 6 0.445 7 0.372 8 0.468 9 0.348 10 0.43 Total 4.582
Adicionalmente a la muestra 01, se analizaran en conjunto con la muestra 02 y 03 para encontrar su mediana, el primer cuartil y segundo cuartil. 0.344 0.348 0.352 0.372 0.416 0.416 0.427 0.430 0.430 0.434 0.444 0.444 0.445 0.446 0.453 0.457 0.459 0.468 0.469 0.473 0.482 0.482 0.482 0.489 0.501 0.502 0.540 0.543 0.556 0.575 Mediana = promedio del 15° y 16° número = (0.453+0.457) /2 = 0.455 Primer cuartil = 0.25(n+1) = 0.25(30+1) = 7.75 (7° y 8°) = (0.427+0.430) /2 = 0.4285 13
Tercer cuartil = 0.75(n+1) = 0.75(30+1) = 23.25 (23° y 24°) = (0.482+0.489) /2 = 0.4855
Resumen estadístico para datos categóricos Parámetro: es una medición numérica que describe algunas características de una población. Dato estadístico: es una medición numérica que describe algunas características de una muestra. Una distribución de frecuencias (o tabla de frecuencias) indica cómo un conjunto de datos se divide en varias categorías (o clases) al listar todas las categorías junto con el número de valores de los datos que hay en cada una. La frecuencia de una clase en particular es el número de valo- res originales que caen en esa clase. La proporción muestral es la frecuencia dividida entre el tamaño de la muestra.
Con los datos de la población total de muestras de diámetros de fibras Stipa Ichu ejemplificaré un resumen estadístico para datos categórico. 0.344 0.348 0.352 0.372 0.416 0.416 0.427 0.430 0.430 0.434 0.444 0.444 0.445 0.446 0.453 0.457 0.459 0.468 0.469 0.473 0.482 0.482 0.482 0.489 0.501 0.502 0.540 0.543 0.556 0.575 Muestra = 30 probetas de fibras Stipa Ichu Categoría agrupada por el mismo ancho decimal, omitiendo las centésimas 0.30mm = 4 muestras 0.40mm = 20 muestras 0.50mm = 6 muestras Lo anterior, representa una frecuencia: 4, 6 y 20 Proporciones muestrales: 4/30=0.13 6/30=0.20 20/30=0.66
14
Resumen gráfico
Una gráfica adecuada permite representar un conjunto de datos que revele de manera clara algunas características importantes. Entre las diversas gráficas estadísticas encontramos las siguientes: Gráficas de tallo y hojas Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la hoja (el dígito del extremo derecho). Características de un diagrama de tallo y hojas: a) Muestra la forma de la distribución de los datos. b) Conserva los valores de los datos originales. c) Los datos muestrales aparecen ordenados. Ejemplo: Derivado del estudio de la influencia del tiempo de tratamiento alcalino en las fibras de ichu*, se obtuvieron los siguientes resultados de la prueba a tracción (Mpa): 26.674, 43.235, 51.781, 51.782, 51.782, 53.352, 61.194, 61.195, 64.333, 64.333, 64.335, 69.041, 69.042, 69.042, 78.454, 81.595, 86.301, 89.438, 91.008, 94.144, 103.562, 105.910, 122.389, 139.650. Tallo 2 4 5 6 7 8 9 10 12 13
15
Hoja 6.674 3.235 1.781, 1.782, 3.352 1.194, 1.195, 4.333, 4.333, 4.3335, 9.041, 9.042, 9.042, 8.454, 1.595, 6.301, 9.438 1.008, 4.144, 3.562, 5.910 2.389 9.650
* “Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA”, por los autores, Abel Gire Quispe y Alexander Giovani Caceres Lupaca.
Diagrama de puntos Una gráfica de puntos es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores. Los puntos que representan valores iguales se apilan. Es útil cuando el tamaño de la muestra no es demasiado grande y cuando la muestra contiene algunos valores repetidos. Figura 7. Diagrama de puntos de los ensayos de dureza Shore D de compuestos de fibra con biopólimeros*.
Fuente: Gráfico elaborado con MiniTab.
Histograma Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin espacios entre sí). La escala horizontal representa clases de valores de datos cuantitativos, en tanto que la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia. Usos importantes de un Histograma: Despliega visualmente la forma de la distribución de los datos. Muestra la ubicación del centro de los datos. Muestra la dispersión de los datos. Identifica los valores atípicos. Pasos para la construcción del Histograma: 1) En muchos casos es razonable tomar el número de intervalos de clase aproximadamente igual a la raíz cuadrada del tamaño de la muestra. 2)En la columna “Frecuencia”, se presentan los números de puntos de datos que están en cada uno de los intervalos de clase. 3) En la columna “Frecuencia relativa” se presentan las frecuencias divididas entre el número total de datos. Estas deberán de sumar 1. 4) La densidad representa la frecuencia relativa entre el ancho de la clase se ajusta esta tendencia. 5) Dibujar un rectángulo para cada clase, cuya altura sea igual a la densidad. 16
De la tesis titulada “Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de stipa ichu (pasto de paramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia”, por la autora, Gabriela Anabel Iza Tutillo, se realizaron los ensayos a flexión (Mpa) de 20 probetas y se obtuvieron los siguientes datos: 18519.81, 9430.55, 14291.19, 18212.06, 12102.84, 27240.404, 12335.802, 26286.125, 26021.262, 34385.869, 2916.04, 1795.46, 2694.68, 2770.94, 2929.65, 2672.51, 1910.27, 1705.20, 1705.20, 1676.60. Figura 8. Tabulación base del Histograma. Intervalo de resistencia a la flexión (Mpa) 1,676.60<1,910.27 1,910.27<2,929.65 2,929.65<18,519.81 18,519.81<34,385.869
Ancho de clase
Frecuencia
233.67 1,019.38 15,590.16 15,866.059
5 5 6 4 20
Frecuencia relativa 0.20000 0.20000 0.16667 0.25000 1
Densidad 0.04 0.04 0.027777778 0.0625
7 6 5 4
1,676.60 1,910.27
2,929.65
18,519.81
34,385.869
Fuente: Elaboración propia.
Un histograma es perfectamente simétrico si su mitad derecha es una imagen de espejo de su mitad izquierda. Los histogramas que no son simétricos se llaman sesgados. Un histograma con una cola larga a la derecha se dice que está sesgado a la derecha o positivamente sesgado. Un histograma largo con una cola larga a la izquierda se dice que está sesgado a la izquierda o negativamente sesgado. Se ha usado el término “moda” para referirnos al valor que ocurre con más frecuencia en una muestra. Este término también se usa en histogramas y otras curvas para referirse a un pico o máximo local. Un histograma es unimodal si tiene solamente un pico, o moda, y bimodal si tiene evidentemente dos modas distintas. 17
Diagrama de cajas Una gráfica de caja (o diagrama de caja y bigotes) es una gráfica de un conjunto de da-tos que consiste en una línea que se extiende desde el valor mínimo hasta el valor máximo, y una caja con líneas dibujadas en el primer cuartil Q1, la mediana y el tercer cuartil Q3. Procedimiento para elaborar una gráfica de caja: 1. Encuentre el resumen de 5 números (valor mínimo, Q1, Q2, Q3, valor máximo). 2. Construya un segmento de línea que se extienda desde el valor mínimo hasta el valor máximo de los datos. 3. Construya una caja (rectángulo) que se extienda de Q1 a Q3, y dibuje una línea en la caja sobre el valor de Q2 (la mediana). Ejemplo: Utilizando los datos de la primera muestra de diámetros de las fibras Ichu* se procede a realizar el diagrama de caja comparandola con una muestra de fibras de otra planta (Chilliwa). Figura 9. Diagrama de caja comparativos. # 1 2 3 4 5 6 7 8 9 10 Total
Stipa Ichu (mm) Chilliwa(mm) Muestra 1 Muestra 2 0.556 0.748 0.54 0.865 0.501 1.55 0.469 1.946 0.453 1.255 0.445 0.76 0.372 0.878 0.468 0.886 0.348 0.859 0.43 0.938 4.582 10.685
Fuente: Elaboración con MiniTab.
Diagrama de dispersión Un diagrama de dispersión es una gráfica de datos cuantitativos pareados (x, y), con un eje x horizontal y un eje y vertical. El eje horizontal se utiliza para la primera variable (x), y el eje vertical para la segunda variable. El patrón de los puntos graficados suele ser útil para determinar si existe una relación entre las dos variables.
18
Correlación de variables Existe una correlación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta. El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores cuantitativos pareados x y y en una muestra. También se conoce como coeficiente de correlación producto momento de Pearson, en honor de Karl Pearson (1857-1936), quien lo desarrolló originalmente. Puesto que el coeficiente de correlación lineal r se calcula utilizando datos muestrales, se trata de un estadístico muestral empleado para medir la fuerza de la correlación lineal entre x y y. Figura 10. Diagramas de dispersión.
19
Fuente: Gráfico tomado del libro Estadística por Triola.
Los valores del coeficiente de correlación cercanos a 1 o a -1 indican fuerte relación lineal; asimismo, valores cercanos a 0 indican débil relación lineal. Valores positivos del coeficiente de correlación indican que la recta de mínimos cuadrados tiene pendiente positiva, ello significa que valores mayores de una variable están asociados con valores mayores que los demás (directamente proporcional). Por el contrario, valores negativos del coeficiente de correlación indican que la recta de mínimos cuadrados tiene pendiente negativa, lo anterior muestra que valores mayores de una variable están relacionados con valores menores que los demás (inversamente proporcional).
Ejemplo: En el seminario de Sistemas de Materiales Emergentes se realizó un prototipo de enfriamiento pasivo. El sistema consta de un Muro Trombe a base de cartón corrugado como elemento principal de toda la estructura, en el interior se encuentran 16 latas de aluminio recicladas pintadas de color negro en aerosol y cubiertas de una placa de plástico microcorrugado opaco, todo lo anterior sellado con silicón de uso general para evitar salidas de aire. El objetivo es reducir la temperatura del espacio adiabático mediante la aplicación del principio termodinámico , el cual cons iste en utilizar la radiación solar para generar un movimiento c onvectivo en la cavidad entre el vidrio y las latas de al u minio al interior de l muro T rombe , lo que propicia un desplazamiento del volumen de aire caliente del interior hacia el exterior por medio de este muro/ chimenea.
Fuente: Fotografías elaboración propia.
20
Por lo anterior, se observó una correlación entre la temperatura externa con la del interior del espacio. Puesto que al estar más caliente el ambiente se producía una disminución de temperatura en el interior. La muestra 01 son datos recopilados en la mañana, mientras que la muestra 02, son por la tarde. Figura 11. Tabulación de datos de temperatura. MUESTRA 1
X # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Horario
09:00:00 a. m. 09:15:00 a. m. 09:30:00 a. m. 09:45:00 a. m. 10:00:00 a. m. 10:15:00 a. m. 10:30:00 a. m. 10:45:00 a. m. 11:00:00 a. m. 11:15:00 a. m. 11:30:00 a. m. 11:45:00 a. m. 12:00:00 p. m. 12:15:00 p. m. 12:30:00 p. m. 12:45:00 p. m.
Y
(X-Xmedia) (Y-Ymedia) (X-Xmedia)^2 (Y-Ymedia)^2 (X-Xmedia)/Sx (Y-Ymedia)/Sy
Temperatura Interior °C Temperatura Exterior °C
Sumatoria Promedio
28.3000
29.6000
-3.1787
-5.9500
10.1045
35.4025
-2.1959
-1.7278
3.7941
29.4000
31.6000
-2.0788
-3.9500
4.3212
15.6025
-1.4360
-1.1470
1.6472
30.1000
32.0000
-1.3787
-3.5500
1.9010
12.6025
-0.9524
-1.0309
0.9819
30.4000
32.7000
-1.0788
-2.8500
1.1637
8.1225
-0.7452
-0.8276
0.6167
31.4000
33.7000
-0.0787
-1.8500
0.0062
3.4225
-0.0544
-0.5372
0.0292
32.1000
34.1000
0.6213
-1.4500
0.3860
2.1025
0.4292
-0.4211
-0.1807
32.7000
38.6000
1.2213
3.0500
1.4915
9.3025
0.8436
0.8857
0.7472
33.6000
40.4000
2.1213
4.8500
4.4997
23.5225
1.4654
1.4084
2.0638
29.6000
34.4000
-1.8787
-1.1500
3.5297
1.3225
-1.2978
-0.3339
0.4334
31.5000
38.4000
0.0213
2.8500
0.0005
8.1225
0.0147
0.8276
0.0121
31.9000
38.7000
0.4213
3.1500
0.1775
9.9225
0.2910
0.9147
0.2662
32.2000
41.2000
0.7213
5.6500
0.5202
31.9225
0.4982
1.6407
0.8175
32.2000
40.2000
0.7213
4.6500
0.5202
21.6225
0.4982
1.3503
0.6728
32.6600
35.7000
1.1813
0.1500
1.3954
0.0225
0.8160
0.0436
0.0355
32.7000
33.4000
1.2213
-2.1500
1.4915
4.6225
0.8436
-0.6243
-0.5267
32.9000
34.1000
1.4213
-1.4500
0.9818
-0.4211
503.6600
568.8000
31.4788
35.5500
S
1.495066888
3.556590127
r (Coef. de Co.)
0.687298519
2.0200
2.1025
33.5284
189.7400
1.44759229
3.443653583
Horario
Y
Temperatura Interior °C
(X-Xmedia) (Y-Ymedia) (X-Xmedia)^2
(Y-Ymedia)^2
-0.4134 10.9968
MUESTRA 2 X #
((X-Xmedia)/Sx) ((Y-Ymedia)/Sy)
(X-Xmedia)/Sx (Y-Ymedia)/Sy
((X-Xmedia)/Sx) ((YYmedia)/Sy)
Temperatura Exterior °C
1
01:00:00 p. m.
32.8000
37.3000
-0.3562
2.1625
0.1269
4.6764
-0.6274
0.7862
-0.4933
2
01:15:00 p. m.
32.8000
43.0000
-0.3562
7.8625
0.1269
61.8189
-0.6274
2.8586
-1.7934
3
01:30:00 p. m.
33.2000
39.0000
0.0438
3.8625
0.0019
14.9189
0.0770
1.4043
0.1082
4
01:45:00 p. m.
33.8000
37.5000
0.6438
2.3625
0.4144
5.5814
1.1336
0.8590
0.9738
5
02:00:00 p. m.
34.4000
35.7000
1.2438
0.5625
1.5469
0.3164
2.1903
0.2045
0.4479
6
02:15:00 p. m.
34.1000
35.2000
0.9438
0.0625
0.8907
0.0039
1.6620
0.0227
0.0378
7
02:30:00 p. m.
33.3000
34.6000
0.1438
-0.5375
0.0207
0.2889
0.2531
-0.1954
-0.0495
8
02:45:00 p. m.
33.3000
34.6000
0.1438
-0.5375
0.0207
0.2889
0.2531
-0.1954
-0.0495
9
03:00:00 p. m.
32.9000
33.8000
-0.2562
-1.3375
0.0657
1.7889
-0.4513
-0.4863
0.2194
10
03:15:00 p. m.
33.2000
33.6000
0.0438
-1.5375
0.0019
2.3639
0.0770
-0.5590
-0.0431
11
03:30:00 p. m.
33.3000
33.3000
0.1438
-1.8375
0.0207
3.3764
0.2531
-0.6681
-0.1691
12
03:45:00 p. m.
33.2000
33.6000
0.0438
-1.5375
0.0019
2.3639
0.0770
-0.5590
-0.0431
13
04:00:00 p. m.
33.0000
33.3000
-0.1562
-1.8375
0.0244
3.3764
-0.2752
-0.6681
0.1838
14
04:15:00 p. m.
32.7000
32.7000
-0.4562
-2.4375
0.2082
5.9414
-0.8035
-0.8862
0.7120 1.3255
15
04:30:00 p. m.
32.4000
32.4000
-0.7562
-2.7375
0.5719
7.4939
-1.3318
-0.9953
16
04:45:00 p. m.
32.1000
32.6000
-1.0562
-2.5375
1.1157
6.4389
-1.8601
-0.9226
530.5000
562.2000
5.1594
121.0375
0.567856441
2.750426103
Sumatoria Promedio S r (Coef. de Co.)
33.1563
35.1375
0.58647961
2.840627865
1.7161 3.0837
0.192730524
Fuente: Elaboración propia.
1. Ambas muestras no presentan una buena correlación. 2. La muestra 01 tiende a inclinarse hacia arriba y a la derecha, lo que indica una asociación en la recta positiva. Sin embargo, no alcanza una correlación de 1. 4. En el caso de la muestra 02, los datos se muestran bastante dispersos y su recta no tiene casi nada de pendiente. 5. En el caso de la muestra 01, los datos atípicos pueden ser por los cambios bruscos de temperatura o errores al momento de la medición. 21
Figura 12. Gráficas de dispersión.
Fuente: Elaborado con programa MiniTab.
22
Recta de los mínimos cuadrados Existe una correlación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta. El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores cuantitativos pareados x y y en una muestra. También se conoce como coeficiente de correlación producto momento de Pearson, en honor de Karl Pearson (1857-1936), quien lo desarrolló originalmente. Puesto que el coeficiente de correlación lineal r se calcula utilizando datos muestrales, se trata de un estadístico muestral empleado para medir la fuerza de la correlación lineal entre x y y. Figura 13. Gráfica de dispersión
Fuente: Elaboración con programa MiniTab.
23
El coeficiente de determinación es la cantidad de variación en y que se explica por la recta de regresión. Se calcula como:
24
De la tesis titulada “Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de stipa ichu (pasto de paramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia”, por la autora, Gabriela Anabel Iza Tutillo, se realizaron los ensayos a tracción de 15 probetas de biocompuestos a base de Stipa Ichu, Algodón y PLA, con una relación 70%/30% de matriz/refuerzo y un proceso de secado al natural, de la muestra 01 se procesaron los datos para obtener su recta de los mínimos cuadrados: Figura 14. Tabulación de datos deforación/esfuerzo a tracción. MUESTRA 1
X #
Ancho de probeta (mm) Deformación Unitaria
(Xi-media) (Yi-media) Producto (X)(Y)
(Xi-media)2
Y circunflejo
ei
Esfuerzo Máximo a Tracción (Mpa)
1
25.000
0.0149
6.7900
-0.0009
-1.5680
0.0015 0.00000087111
7.544289951 -0.7543
2
24.910
0.0142
6.5200
-0.0016
-1.8380
0.0030 0.00000266778
6.934007414 -0.4140 14.95486361 1.2551
3
24.750
0.0234
16.2100
0.0076
7.8520
0.0594 0.00005725444
4
25.000
0.0158
8.5800
0.0000
0.2220
0.0000 0.00000000111
8.328938927 0.2511
5
25.000
0.0152
9.1200
-0.0006
0.7620
-0.0005 0.00000040111
7.805839609 1.3142
6
24.900
0.0130
6.1900
-0.0028
-2.1680
0.0061 0.00000802778
5.887808779 0.3022
7
24.780
0.0120
4.6000
-0.0038
-3.7580
0.0144 0.00001469444
5.015976583 -0.4160 5.015976583 1.1440
8
24.600
0.0120
6.1600
-0.0038
-2.1980
0.0084 0.00001469444
9
24.600
0.0150
5.9900
-0.0008
-2.3680
0.0020 0.00000069444
7.63147317 -1.6415
10
25.000
0.0130
6.5400
-0.0028
-1.8180
0.0052 0.00000802778
5.887808779 0.6522
11
24.860
0.0200
10.0200
0.0042
1.6620
0.0069 0.00001736111
11.99063415 -1.9706
12
24.900
0.0160
6.9000
0.0002
-1.4580
-0.0002 0.00000002778
8.503305366 -1.6033
13
25.250
0.0150
7.7800
-0.0008
-0.5780
0.0005 0.00000069444
7.63147317 0.1485
14
24.700
0.0200
11.4600
0.0042
3.1020
0.0129 0.00001736111
11.99063415 -0.5306
24.720
0.0180
12.5100
0.0022
4.1520
0.0090 0.00000469444
10.24696976 2.2630
Promedio
0.0158
8.3580
15
25
Y
Fuente: Gráfico elaborado en Excel.
Sumatoria
0.1286 0.00014747333
Pendiente
871.8322
Intercepto
-5.446010
Por otro lado, en una segunda muestra se realizaron los ensayos a tracción de otras 15 probetas de biocompuestos a base de Stipa Ichu, Algodón y PLA, con una relación 70%/30% de matriz/refuerzo, sin embargo el proceso de secado en lugar de ser al natural tuvo un tratamiendo precocido, en esta segunda se procesaron los datos para obtener su recta de los mínimos cuadrados:
Figura 15. Tabulación de datos deforación/esfuerzo a tracción. MUESTRA 2
X #
Ancho de probeta (mm)
Y
Deformación Unitaria
(Xi-media)
(Yi-media)
Producto (X)(Y)
(Xi-media)2
Y circunflejo
ei
Esfuerzo Máximo a Tracción (Mpa)
1
24.800
0.0260
9.5800
0.0067
0.8156
0.0054
0.0000444444
12.61473943
-3.0347
2
24.970
0.0150
5.8500
-0.0043
-2.9144
0.0126
0.0000187778
6.261679373
-0.4117
3
24.800
0.0190
8.7800
-0.0003
0.0156
0.0000
0.0000001111
8.571883029
0.2081
4
25.000
0.0170
6.6200
-0.0023
-2.1444
0.0050
0.0000054444
7.416781201
-0.7968
5
25.000
0.0140
6.0400
-0.0053
-2.7244
0.0145
0.0000284444
5.68412846
0.3559
6
25.000
0.0240
12.9500
0.0047
4.1856
0.0195
0.0000217778
11.4596376
1.4904
7
24.750
0.0230
12.1400
0.0037
3.3756
0.0124
0.0000134444
10.88208668
1.2579
8
25.000
0.0240
10.8600
0.0047
2.0956
0.0098
0.0000217778
11.4596376
-0.5996 1.4353
9
24.900
0.0260
14.0500
0.0067
5.2856
0.0352
0.0000444444
12.61473943
10
24.840
0.0180
10.5100
-0.0013
1.7456
-0.0023
0.0000017778
7.994332115
2.5157
11
24.600
0.0200
8.1100
0.0007
-0.6544
-0.0004
0.0000004444
9.149433943
-1.0394 -1.5617
12
24.650
0.0150
4.7000
-0.0043
-4.0644
0.0176
0.0000187778
6.261679373
13
24.800
0.0180
8.8000
-0.0013
0.0356
0.0000
0.0000017778
7.994332115
0.8057
14
24.600
0.0140
6.6460
-0.0053
-2.1184
0.0113
0.0000284444
5.68412846
0.9619
-0.0023
0.0068
0.0000054444
7.416781201
-1.5868
0.1475
0.0002553333
15
24.760
0.0170
5.8300
Promedio
0.0193
8.7644
Fuente: Gráfico elaborado en Excel.
-2.9344 Sumatoria Pendiente
577.5509
Intercepto
-2.401584
26
Comparación de modelos Los modelos son una descripción esquemática (aproximada) de los sistemas y fenómenos (reales / naturales). Un modelo resultará útil en la medida en que sus propiedades tienen correspondencia con las del mundo real. La estrategia general de la modelación matemática que aquí se muestra consta de los siguientes pasos: Definición del problema y sus objetivos Definición de la teoría que gobierna el problema Descripción de la situación física en términos matemáticos Solución matemática del modelo. Comparación del modelo con la situación real. Estudio de las limitaciones del modelo. Aplicación del modelo e interpretación de los resultados que ofrece. Figura 16. Proceso de modelado.
Fuente: Gráfico tomado del artículo “Papel de la modelación matemática en la formación de los ingenieros Estadística” por Brito.
27
Cuando se tienen mas de un modelo para un mismo fenómeno o prueba se realiza un proceso de comparación de la “bondad” y ajuste del modelo a los valores “reales” (observados o medidos). La elección dependerá si el modelo es lo suficientemente “bueno” (preciso) para los propósitos de la investigación y al nivel que se busca. El error cuadrático medio (RMSE) mide la cantidad de error que hay entre dos conjuntos de datos. En otras palabras, compara un valor predicho y un valor observado o conocido.
Figura 17. Tabulación de datos deforación/esfuerzo a tracción para sacar el REMC. MUESTRA 1 X # 1
Ancho de probeta (mm)
Y
Deformación Unitaria
25.000
(Xi-media)
(Yi-media)
Producto (X)(Y)
(Xi-media)2
Y circunflejo
ei
ei2
Esfuerzo Máximo a Tracción (Mpa) 6.7900
-0.0009
-1.5680
7.544289951
-0.7543
0.56895333
2
24.910
0.0142
6.5200
-0.0016
-1.8380
0.0030
0.000002668
6.934007414
-0.4140
0.171402139
3
24.750
0.0234
0.0149
16.2100
0.0076
7.8520
0.0594
0.0015
0.000057254
0.000000871
14.95486361
1.2551
1.57536735
4
25.000
0.0158
8.5800
0.2220
0.0000
5
25.000
0.0152
9.1200
-0.0006
0.7620
-0.0005
0.000000401
7.805839609
1.3142
1.72701753
6
24.900
0.0130
6.1900
-0.0028
-2.1680
0.0061
0.000008028
5.887808779
0.3022
0.091319534
7
24.780
0.0120
4.6000
-0.0038
-3.7580
0.0144
0.000014694
5.015976583
-0.4160
0.17303652 1.308789578
0.0000
0.000000001
8.328938927
0.2511
0.063031662
8
24.600
0.0120
6.1600
-0.0038
-2.1980
0.0084
0.000014694
5.015976583
1.1440
9
24.600
0.0150
5.9900
-0.0008
-2.3680
0.0020
0.000000694
7.63147317
-1.6415
2.69443417
10
25.000
0.0130
6.5400
-0.0028
-1.8180
0.0052
0.000008028
5.887808779
0.6522
0.425353389
11
24.860
0.0200
10.0200
0.0042
1.6620
0.0069
0.000017361
11.99063415
-1.9706
3.88339895
-0.0002
0.000000028
8.503305366
-1.6033
2.570588096
12
6.9000
0.0002
-1.4580
13
25.250
0.0150
7.7800
-0.0008
-0.5780
0.0005
0.000000694
7.63147317
0.1485
0.02206022
14
24.700
24.900
0.0200
0.0160
11.4600
0.0042
3.1020
0.0129
0.000017361
11.99063415
-0.5306
0.281572600
15
24.720
0.0180
12.5100
0.0022
4.1520
0.0090
0.000004694
10.24696976
2.2630
Promedio
0.0158
8.3580
0.1286
0.000147473
Sumatoria Pendiente
871.8322
Intercepto
-5.446010
5.12130588
Promedio
1.37850873
Raíz
1.174099114
REMC%
14.04760845
MUESTRA 2 X #
Y
Ancho de probeta (mm) Deformación Unitaria
(Xi-media)
(Yi-media)
Producto (X)(Y)
(Xi-media)2
Y circunflejo
ei
ei2
Esfuerzo Máximo a Tracción (Mpa)
1
24.800
0.0260
9.5800
0.0067
0.8156
0.0054
0.0000
12.61473943
-3.0347
9.20964338
2
24.970
0.0150
5.8500
-0.0043
-2.9144
0.0126
0.0000
6.261679373
-0.4117
0.169479906
3
24.800
0.0190
8.7800
-0.0003
0.0156
0.0000
0.0000
8.571883029
0.2081
0.04331267
4
25.000
0.0170
6.6200
-0.0023
-2.1444
0.0050
0.0000
7.416781201
-0.7968
0.634860282
5
25.000
0.0140
6.0400
-0.0053
-2.7244
0.0145
0.0000
5.68412846
0.3559
0.12664455
6
25.000
0.0240
12.9500
0.0047
4.1856
0.0195
0.0000
11.4596376
1.4904
2.221180090
7
10.88208668
1.2579
1.58234591
8
25.000
0.0240
10.8600
0.0047
2.0956
0.0098
0.0000
11.4596376
-0.5996
0.359565249
9
24.900
24.750
0.0260
0.0230
14.0500
12.1400
0.0067
0.0037
5.2856
3.3756
0.0352
0.0124
0.0000
0.0000
12.61473943
1.4353
2.05997292
10
24.840
0.0180
10.5100
-0.0013
1.7456
-0.0023
0.0000
7.994332115
2.5157
6.328584908
11
24.600
0.0200
8.1100
0.0007
-0.6544
-0.0004
0.0000
9.149433943
-1.0394
1.08042292
12
24.650
0.0150
4.7000
-0.0043
-4.0644
0.0176
0.0000
6.261679373
-1.5617
2.438842465
13
24.800
0.0180
8.8000
-0.0013
0.0356
0.0000
0.0000
7.994332115
0.8057
0.64910074
14
24.600
0.0140
6.6460
-0.0053
-2.1184
0.0113
0.0000
5.68412846
0.9619
0.925196860
24.760
0.0170
5.8300
-0.0023
-2.9344
0.0068
0.0000
7.416781201
Promedio
0.0193
8.7644
0.1475
0.0003
15
Sumatoria Pendiente
577.5509
Intercepto
-2.401584
-1.5868
2.51787458
Promedio
2.02313516
Raíz
1.422369559
REMC% 16.2289439
Fuente: Gráfico elaborado en Excel.
28
Gráfica de residuos
Una gráfica residual es un diagrama de dispersión de los valores (x, y) después de remplazar cada uno de los valores de la coordenada y por el valor del residuo y-y circunfleja (donde y circunfleja expresa el valor predicho de y). Es decir, una gráfica residual es una gráfica de los puntos (x, y-y circunfleja). Puede ser otra herramienta útil para analizar los resultados de correlación y regresión, así como para verificar los requisitos necesarios para hacer inferencias sobre la correlación y la regresión. La gráfica residual no debe tener ningún patrón obvio (ni siquiera un patrón en línea recta). (Esta ausencia de un patrón confirma que un diagrama de dispersión de los datos muestrales tiene un patrón en línea recta en vez de otro patrón). La gráfica residual no debe ser mucho más ancha (o más delgada) al recorrerla de izquierda a derecha. (Esto confirma el requisito de que para los diferentes valores fijos de x, las distribuciones de los valores y correspondientes tienen la misma desviación estándar). Cuando la dispersión vertical en un diagrama de dispersión no varía demasiado, se dice que el diagrama de dispersión es homoscedástico. Lo contrario de homoscedástico es heteroscedástico. Figura 18. Gráficas residuales.
29
Fuente: Gráfico tomado del libro Estadística por Triola.
Una gráfica de residuos que se ve bien no prueba por sí misma que el modelo lineal es adecuado, porque los supuestos del modelo lineal pueden fallar de otras maneras. Por otra parte, una gráfica de residuos con un defecto serio indica claramente que el modelo lineal es inadecuado. Transformación de variables
En general, sustituir una variable con una función de la misma se llama transformación de la variable. Específicamente, elevar una variable a una potenciase llama transformación potencia. En un diagrama de dispersión, un valor atípico es un punto que cae lejos de los demás puntos de datos. Los datos muestrales pareados pueden incluir uno o más puntos influyentes, que son puntos que afectan fuertemente la gráfica de la línea de regresión. Ejemplo: Gráficas de valores ajustados contra residuos de la Muesta 01. MUESTRA 1 TRANSFORMACIÓN X # 1
Y
Ancho de probeta (mm) Deformación Unitaria
ei2
46.1041
-0.0009
0.0304 0.000000871
62.27436338
-16.1703
261.47741762
24.910
0.0142
6.5200
42.5104
-0.0016
-36.1972
0.0591 0.000002668
49.94947091
-7.4391
55.339775950
24.750
0.0234
16.2100
262.7641
0.0076
184.0565
1.3927 0.000057254
211.9337719
50.8303 2583.72225236
0.0158
6.7900
ei
2
25.000
0.0149
(Xi-media) (Yi-media) Producto (X)(Y) (Xi-media)2 Y circunflejo
Esfuerzo Máximo a Tracción (Mpa)
3 4
25.000
Y2
Esfuerzo Máximo a Tracción (Mpa)
8.5800
73.6164
0.0000
-32.6035
-5.0912
0.0002 0.000000001
78.12065369
-4.5043
5
25.000
0.0152
9.1200
83.1744
-0.0006
4.4668
-0.0028 0.000000401
67.55646015
15.6179
243.92004524
6
24.900
0.0130
6.1900
38.3161
-0.0028
-40.3915
0.1144 0.000008028
28.82108382
9.4950
90.155332312
4.6000
21.1600
-0.0038
-57.5476
7
24.780
0.0120
0.2206 0.000014694
11.21409458
8
24.600
0.0120
6.1600
37.9456
-0.0038
-40.7620
0.1563 0.000014694
11.21409458
9
24.600
0.0150
5.9900
35.8801
-0.0008
-42.8275
0.0357 0.000000694
64.0350623
-0.0028
10
792.70190207
0.0130
6.5400
42.7716
0.1018 0.000008028
28.82108382
13.9505 194.616901767
11
24.860
0.0200
10.0200
100.4004
0.0042
21.6928
0.0904 0.000017361
152.0700085
-51.6696 2669.74844297
24.900
0.0160
6.9000
47.6100
0.0002
-31.0976
-0.0052 0.000000028
81.64205154
-34.0321 1158.180532032
60.5284
-0.0008
-18.1792
25.250
0.0150
7.7800
-35.9360
98.92103470
26.7315 714.573382223 -28.1550
12 13
25.000
9.9459
20.288301322
0.0151 0.000000694
64.0350623
14
24.700
0.0200
11.4600
131.3316
0.0042
52.6240
0.2193 0.000017361
152.0700085
-20.7384 430.081587284
15
24.720
0.0180
12.5100
156.5001
0.0022
77.7925
0.1686 0.000004694
116.85603
39.6441 1571.65228441
Promedio
0.0158
8.3580
78.7076
Sumatoria
2.5966 0.000147473
Pendiente
17606.9892
Intercepto
-200.069776
-3.5067
12.29668048
Promedio
726.51172485
Raíz
26.95388144
Fuente: Gráfico elaborado con Excel.
La gráfica de residuos no presenta una tendencia perceptible, es casi homoscedástica, aunque la maoria de los datos se aglomeran de un lado. Se puede observar un dato atípico en la esquina superior derecha. Pareciera un modelo creible, pero se puede realizar otra transformación de potencia pero ahora en las x. 30
Bibliografía
Bernal Torres, C. A., Cruz Buelvas, L. E., & Fernandez Palma, O. (2014). Metodología de la investigación: Administración, economía, humanidades y ciencias sociales (Cuarta edición). http://pbidi.unam.mx:8080/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=cat02025a&AN=lib.MX001001976565&lang=es&site=e ds-live Brito-Vallina, M. L., Alemán-Romero, I., Fraga-Guerra, E., Para-García, J. L., & Arias-de Tapia, R. I. (2011). Papel de la modelación matemática en la formación de los ingenieros. Ingeniería Mecánica, 14(2), 129-139. Diseños factoriales y factoriales fraccionados. (s. f.). [Mtbconcept]. Recuperado 14 de junio de 2021, de https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/doe/supporting-topics/factorial-and-screening-designs/factorial-andfractional-factorial-designs/ Gire Quispe, A., & Caceres Lupaca, A. G. (2019). Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA. Universidad Nacional de San Agustín de Arequipa. http://repositorio.unsa.edu.pe/handle/UNSA/11140 Hernández-Sampieri, R., & Mendoza Torres, C. P. (2018). Metodología de la investigación: Las rutas cuantitativa, cualitativa y mixta. McGraw-Hill Interamericana. http://ebookcentral.proquest.com/lib/bibliodgbsp/detail.action?docID=5485814 Montero Lorenzo, J. M. (2007). Estadística descriptiva. Paraninfo; Gale eBooks. http://link.gale.com/apps/pub/3BCM/GVRL?sid=bookmark-GVRL
31
Triola, M. F., Pineda Ayala, L. E., & Triola, M. F. (2013). Estadística (Decimoprimera edición). Pearson. http://pbidi.unam.mx:8080/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=cat02025a&AN=lib.MX001001976387&lang=es&site=e ds-live
Tutillo, I., & Anabel, G. (2017). Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de STIPA ICHU (pasto de páramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia. https://repositorio.uta.edu.ec:8443/jspui/handle/123456789/26085
32