Guía de procedimientos e interpretación de datos_Villalobos García Stephanie by Stephanie Viga

Procedimientos e interpretación de datos

“Guía de trabajos y actividades” Stephanie Villalobos García

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO PROGRAMA DE MAESTRÍA Y DOCTORADO EN ARQUITECTURA CAMPO DE CONOCIMIENTO: TECNOLOGÍAS 2021 Asesor: Mtro En Arq Arturo Valeriano Flores Junio 2021

contenido

El proceso de la investigación cuantitativa

Muestreo y variables

Resumen estadístico Media muestral Desviación estandar Datos atípicos Mediana muestral Moda y Rango Cuartiles Percentiles

Resumen gráfico Hoja y tallo Diagrama de puntos Histograma Diagrama de caja Datos multivariados

Correlación de variables Coeficiente de correlación

Recta de los mínimos cuadrados

Comparación de modelos Error medio cuadrático

Gráfica de residuos y valores ajustados

Bibliografía

Proceso de investigación La investigación según Sampieri (2013) se define como el conjunto de procesos sistemáticos, críticos y empíricos que se aplican al estudio de un fenómeno o problema con el objetivo de ampliar su conocimiento. Un tipo de método de investigación es el científico, el cual se refiere al conjunto de procedimientos que, valiéndose de los instrumentos o técnicas necesarias, examina y soluciona un problema o conjunto de problemas de investigación (Bernal, 2014); este método suele dividirse en: 1. Cualitativo: su prioridad es cualificar, describir e interpretar el fenómeno social a partir de rasgos determinados. 2. Cuantitativo o tradicional: se fundamenta en la medición y el análisis de las relaciones entre las variables estudiadas de forma deductiva; tiende a generalizar y normalizar resultados. La ruta cuantitativa de la investigación, representa un conjunto de procesos organizados de manera secuencial para comprobar ciertas suposiciones.

Fase 1 Idea

Fase 6 Desarrollo del diseño de investigación

Fase 2

Figura 1. Proceso cuantitativo. Fase 3 Fase 4

Planteamiento del problema

Revisión de la literatura y desarrollo del marco o perspectiva teórica

Fase 7

Fase 8

Definición y selección de la muestra

Recolección de los datos

Visualización del alcance del estudio

Fase 9 Análisis de los datos

Fase 5 Elaboración de hipótesis y definición de variables

Fase 10 Elaboración del reporte de resultados

Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri.

Cuantitativa

Figura 2. Enfoque cuantitativo. Características

a) Planteamientos específicos b) Orientado en variables medidas c) Prueba de hipótesis y teoria d) Diseños prestablecidos

Proceso

a) Secuencial b) Orientado a la realidad objetiva c) Deductivo d) Probatorio

e) Instrumentos estandarizados f) Datos númericos g) Análisis estadístico sobre una matriz

a) Representatividad y generalización de resultados b) Control sobre fenómenos y precisión c) Réplica d) Predicción

Fortalezas

Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri.

La investigación experimental según Bernal (2014) se realiza mediante los llamados diseños, que son un conjunto de procedimientos con los cuales se manipulan una o más variables independientes y se mide su efecto sobre una o más variables dependientes. En la ruta cuantitativa fijar una muestra representa un ahorro de tiempo y recursos. Una muetra es un subgrupo de la población o universo del cual se recolectan los datos y que debe ser representativo de esta, si se desean generalizar los resultados. Se clasifican en dos tipos: Muestra probabilística: subgrupo de la población en el que todos los elementos de esta tienen la misma posibilidad de ser elegidos. Muestra no probabilística: subgrupo de la población en la que la elección de los elementos no depende de la probabilidad sino de las características de la investigación. Figura 3. Representación de una muestra.

Población

Muestra

Fuente: Elaboración propia.

Procesamiento de datos La recolección de datos es la aplicación de uno o varios instrumentos de medición para recabar la información pertinente de las variables del estudio en la muestra. Los datos obtenidos son la base del análisis, si no se analizan los datos no hay investigación. Una vez obtenidos los datos, deberán seguir un proceso.

Organización

Dar un orden a la información obtenida con abase en las categorías identificadas según sus propiedades y dimensiones. Se pueden encontrar valores de carácter cuantitátivo o cualitativo.

Codificación

Codificar los datos significa asignarles un valor número o símbolo que los represente. Es decir, a las categorías de cada variable se les asigna un valor númerico o signo que tiene un significado.

Análisis e Interpretación

Cuadro de dos o más dimensiones y cada dimensión contiene una variable. A su vez, cada variable se puede subdividir en dos o más categorías

Los datos se interpretan en relación con las suposiciones o predicciones iniciales y de estudios previos. Se estabale una interpretación final, la cual constituye una explicación de cómo los resultados encajan en el conocimiento existente.

Elaboración de conclusiones

Tabulación

Procesamiento

Figura 4. Procesamiento de datos.

En este apartado se debe mostrar los aportes y las limitaciones de los resultados del estudio para la comprensión del problema estudiado. Señalar las excepciones o los aspectos no resueltos del problema de investigación en función de los objetivos y formular temas para futuras investigaciones que se deriven del análisis de sus resultados.

Fuente: Gráfico elaborado a partir del libro Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta por Sampieri y anotaciones de la materia Procedimientos e interpretación de datos.

Descripción general de la investigación Material biocompuesto a base de una matriz bio polimérica reforzada con agregados orgánicos para su uso en la construcción Resumen: Los biopolímeros tienen buenas propiedades mecánicas, plasticidad, biocompatibilidad, se procesan fácilmente y son un material prometedor para diversas aplicaciones de uso en compositos. Asimismo, las fibras vegetales se utilizan ampliamente en materiales poliméricos para mejorar las propiedades mecánicas, son bastante rígidas y se encuentran disponibles con facilidad en la naturaleza. Se está desarrollando un material biocompuesto a base de biopolímeros y aditivos orgánicos para obtener un sustituto del plástico como elemento arquitectónico. Mediante la búsqueda de resinas bioplásticas comerciales y su respectivo análisis para la prefactibilidad como material matriz, se propone combinarla con un residuo sólido agrícola como fase de refuerzo y transformarlo con ayuda de un sistema creado específicamente para la construcción del prototipo. Y como resultado: comprobar la aplicabilidad de materiales biodegradables y de origen renovable en la edificación, comparar sus propiedades mecánicas con materiales sintéticos similares y visualizar la viabilidad de los bioplásticos como sustitutos de los polímeros derivados del petróleo dentro de la industria de la construcción. Enfoque: Cuantitativo Tipo de investigación: Experimental ¿En qué cosiste mi investigación?: Desarrollo de un material biocompuesto para la construcción con la forma de tableros laminados para revestir muros interiores, columnas y muebles. Asimismo, serán útiles para bases de estructuras en pisos, plafones o carpinterías. ¿Qué tipo de datos voy a manejar?: Valores numerales Propiedades físicas y mecánicas del material: Densidad (kg/m3) Módulo de Young (GPa) Resistencia a la tracción (MPa) Fuerza de impacto (kJ/m2) Días de biodegradabilidad en compostaje Porcentaje de absorción de agua Porcentaje de agregado con relación a la matriz 4

Muestreo y variables

La estadística según Triola (2013) es la ciencia que se encarga de planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar e interpretar la información para extraer conclusiones basadas en los datos. La población es el conjunto completo de todos los elementos (puntuaciones, personas, mediciones, etcétera) que se someten a estudio. El conjunto es completo porque incluye a todos los sujetos que se estudiarán. La muestra es un subconjunto de miembros seleccionados de una población. En una muestra aleatoria los miembros de la población se seleccionan de forma que cada miembro individual tenga la misma posibilidad de ser elegido. Con el muestreo aleatorio esperamos que todos los componentes de la población estén representados (aproximadamente) de manera proporcional. Una muestra aleatoria simple de n sujetos se selecciona de manera que cada posible muestra del mismo tamaño n tenga la misma posibilidad de ser elegida. Es importante obtener datos muestrales que sean representativos de la población de la que se obtienen para obtener conclusiones acertadas. Por lo cual es importante considerar lo siguiente: • Los datos muestrales deben reunirse de una forma adecuada, como a través de un proceso de selección aleatoria. • Si los datos muestrales no se reúnen de forma adecuada, resultarán inútiles.

Los métodos estadísticos se rigen por los datos recabados. Por lo regular, obtenemos datos de dos fuentes distintas: los estudios observacionales y los experimentos. En un estudio observacional, vemos y medimos características específicas, pero no intentamos modificar a los sujetos que estamos estudiando. En un experimento aplicamos algunos tratamientos y luego procedemos a observar sus efectos sobre los sujetos. Además de las muestras aleatorias y las muestras aleatorias simples, existen otras técnicas de muestreo, como: Muestreo sistemático: elegimos algún punto de partida y luego selecciona- mos cada k-ésimo (por ejemplo, cada quincuagésimo) elemento en la población. Muestreo de conveniencia: simplemente se utilizan resultados que sean muy fáciles de obtener. Muestreo estratificado: subdividimos a la población en al menos dos sub- grupos (o estratos) diferentes, de manera que los sujetos que pertenecen al mismo subgrupo compartan las mismas características (como el género o la categoría de edad), y luego obtenemos una muestra de cada subgrupo (o estrato). Muestreo por racimos o conglomerados: primero dividimos el área de la población en secciones (o conglomerados), luego elegimos al azar algunos de estos conglomerados, y después elegimos a todos los miembros de los conglomerados seleccionados. Un error de muestreo es la diferencia entre el resultado de una muestra y el verdadero resultado de la población; este error es consecuencia de las fluctuaciones por el azar. Tipos de datos Los datos cuantitativos (o numéricos) consisten en números que representan conteos o mediciones. Los datos categóricos (o cualitativos o de atributo) consisten en nombres o etiquetas que no son números y que, por lo tanto, no representan conteos ni mediciones.

Tipos de experimentos Experimentos de una muestra: Una población de la cual se toma una muestra. Experimentos de muestras múltiples: Dos o más poblaciones de interés y se toma una muestra de cada población. Experimentos factoriales: es un tipo de experimento diseñado que permite estudiar los efectos que varios factores pueden tener en una respuesta. Figura 5. Métodos de muestreo. 1

Muestra

Aleatoria simple

Conglomerado

Estratificado

Conveniencia

Sistemática

Muestra a cada 3

2 1

4 3

2 1

6 5

4 3

II I

Una muestra de cada grupo

IV III

Muestra escogida porque ninguna de sus caras está contaminada

8 7

Todas los lotes de bagazos Bagazo de caña de azúcar Se analizan todas las fibras Bagazo de Agave Tequilana en los lotes seleccionados Bagazo de Agave Angustilofia Haw al azar. Bagazo de Agave Marmorana

Fuente: Gráfico elaborado a partir del libro Estadística por Sampieri y anotaciones de la materia Procedimientos e interpretación de datos.

Definición general de variables Material biocompuesto a base de una matriz bio polimérica reforzada con agregados orgánicos para su uso en la construcción Se plantean las siguientes variables (ver Tabla 1), de las cuales habrá que considerar que por cada variable que se ponga a prueba se necesitará la realización de cinco probetas. Por lo anterior, en total se tendrán 60 probetas categorizadas según su proporción de agregado para hacer su respectiva comparación entre una muestra y otra. Tabla 1. Tabulación de variables.

Biodegradabilidad

Solubilidad

Intemperismo

Resistencia a la flexión

Biopolímero PLA

Biopolímero PLA con agregado al 20%

Biopolímero PLA con agregado al 40%

Total

Muestra 1A

Muestra 1B

Muestra 1C

Muestra 2A

Muestra 2B

Muestra 2C

Muestra 3A

Muestra 3B

Muestra 3C

Muestra 4A

Muestra 4B

Muestra 4C

Fuente: Elaboración propia.

Resumen estadístico

El resumen estadístico es el procedimiento con el cual se pueden obtener las características más evidentes de una muestra. Las medidas de tendencia central son los valores medios de la distribución de frecuencias y son útiles para ubicar los resultados de la muestra en la escala de medición de la variable en cuestión. Las medidas de tendencia central principales son: La media: puede definirse como el promedio aritmético de una distribución, donde la letra griega Σ (sigma mayúscula) indica que los valores de los datos deben sumarse, por lo que Σx representa la suma de todos los valores de los datos. El símbolo n expresa el tamaño de la muestra, que es el número de valores de datos.

La mediana: se puede considerar de manera general como un “valor medio” en el sentido de que aproximadamente la mitad de los valores en un conjunto de datos son menores y la mitad son mayores que la mediana. Para encontrar la mediana, primero ordene los valores (pón-galos en orden) y luego siga uno de los siguientes dos procedimientos: 1. Si el número de valores de datos es impar, la mediana es el número ubicado en el in-termedio exacto de la lista ordenada. 2. Si el número de valores de datos es par, la mediana se obtiene calculando la media de los dos números intermedios de la lista ordenada.

247 260 268 273 276 279 281 283 284 285 286 288 Mediana: Promedio del 6° y 7° lugar (279 + 281)/2 = 280

Media recortada: Debido a que la media es muy sensible a los valores extremos, se dice que no es una medida de tendencia central resistente. Al eliminar algunos valores bajos y altos, la media recortada se hace más resistente. Para encontrar la media recortada del P% para un conjunto de datos, primero ordene los datos, luego elimine el P% de los valores inferiores y el P% de los valores superiores, luego calcule la media de los valores restantes. 247 260 268 273 276 279 281 283 284 285 286 288 Media recortada 10%= 12 X 0.10 = 1.2 (260, 268, 273,...284,285,286)/12 = 231.25

Moda: es el (los) valor(es) que ocurre(n) con mayor frecuencia. No se utiliza mucho con datos cuantitativos, pero es la única medida de tendencia central que puede usarse con datos cualitativos (que consisten solamente en nombres, etiquetas o categorías). Si algunos valores tienen una frecuencia igual, cada uno representa una moda. Las medidas de la variabilidad indican la dispersión de los datos en la escala de medición de la variable en cuestión y responden a la pregunta sobre dónde están diseminadas las puntuaciones obtenidas para muestra o casos. Rango: también denominado recorrido, es la diferencia entre la puntuación superior y la puntuación inferior, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo. Por ejemplo, si en una muestra la persona mayor tiene 30 años y la menor 17, el rango será: 13. Figura 6. Media, Mediana, Moda. Media

Moda

Mediana Fuente: Gráfico elaborado a partir del libro Estadística por Sampieri.

La mitad del rango: es la medida de tendencia central que constituye el valor que se encuentra a la mitad, entre la puntuación más alta y la más baja, en el conjunto original de datos. Se calcula sumando el valor máximo con el valor mínimo y luego dividiendo la suma entre dos. La desviación estándar: o una varianza muestral de un conjunto de valores muestrales, denotada con s, es la medida de variación de los valores con respecto a la media. Las siguientes propiedades son consecuencia de la forma en que se define la desviación estándar: 1) La desviación estándar es una medida de variación de todos los valores con respecto a la media. 2) El valor de la desviación estándar s generalmente es positivo. Solo es igual a cero cuando todos los valores de los datos son el mismo número. (Nunca es negativa). Además, valores grandes de s implican mayores cantidades de variación. 3) El valor de la desviación estándar s puede aumentar de manera drástica con la inclusión de uno o más valores atípicos (valores de datos que se encuentran muy lejos de los demás). 4) Las unidades de la desviación estándar s (como minutos, pies, libras, etcétera) son las mismas de los datos originales. La varianza: de un conjunto de valores es una medida de variación igual al cuadrado de la desviación estándar.

Datos atípicos: puntos que son mucho más grandes o pequeños que el resto dentro de una muestra. Los datos atípicos se deben examinar siempre y cualquiera de ellos que se encuentre es resultado de un error que se debe corregir o eliminar. Un dato atípico se conserva y un error se elimina. Los percentiles y cuartiles son otras medidas de posición útiles para comparar valores dentro del mismo conjunto de datos o entre diferentes conjuntos de datos. Percentiles: son medidas de ubicación, expresadas como P1, P2, . . . , P99, que dividen un conjunto de datos en 100 grupos con aproximadamente el 1% de los valores en cada grupo. Los percentiles con frecuencia se usan para interpretar puntajes de exámenes estandarizados. Por ejemplo, si a una estudiante se le informa que su puntaje en un examen de ingreso a la universidad está en el 64avo. percentil, esto significa que 64% de los estudiantes que presentaron el examen obtuvo puntajes inferiores. El percentil 50, denominado P50, tiene aproximadamente el 50% de los valores de datos por debajo de él y aproximadamente el 50% de los valores de datos por encima de él, por lo que el percentil 50 es igual que la mediana. n = 12, encontrar percentil 65 (0.65)(13) = 8.45 8vo

9no

247 260 268 273 276 279 281 283 284 285 286 288 (283 + 284)/2 = 283.50

Cuartiles: son medidas de ubicación, denominadas Q1, Q2 y Q3, que dividen un conjunto de datos en cuatro grupos con aproximadamente el 25% de los valores en cada uno. Q1 (Primer cuartil): mismo valor que P25. Separa el 25% de los valores inferiores ordenados del 75% superior. (Para ser más precisos, al menos 25% de los valores ordenados son menores o iguales a Q1, y al menos 75% de los valores son mayores o iguales a Q1). Q2 (Segundo cuartil): igual a P50 e igual a la mediana. Separa el 50% de los valores inferiores ordenados del 50% superior. Q3 (Tercer cuartil): igual a P75. Separa el 75% de los valores inferiores ordenados del 25% superior. (Para ser más precisos, al menos 75% de los valores ordenados son menores o iguales a Q3 y al menos 25% de los valores son mayores o iguales a Q3). n = 12, encontrar 1Q o Primer Cuartil (0.25)(13) = 3.25 3ro

4to

247 260 268 273 276 279 281 283 284 285 286 288 (268 + 273)/2 = 270.5

Ejemplo aplicado de Resumen Estadístico De la tesis titulada “Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA”, por los autores, Abel Gire Quispe y Alexander Giovani Caceres Lupaca, se realizaron las mediciones de tres diferentes lotes de muestras de diámetros de la fibra Stipa Ichu, del primer lote de muestra se obtuvieron los siguientes datos: Stipa Ichu (mm) # Muestra 1 1 0.556 2 0.54 3 0.501 4 0.469 5 0.453 6 0.445 7 0.372 8 0.468 9 0.348 10 0.43 Total 4.582

Adicionalmente a la muestra 01, se analizaran en conjunto con la muestra 02 y 03 para encontrar su mediana, el primer cuartil y segundo cuartil. 0.344 0.348 0.352 0.372 0.416 0.416 0.427 0.430 0.430 0.434 0.444 0.444 0.445 0.446 0.453 0.457 0.459 0.468 0.469 0.473 0.482 0.482 0.482 0.489 0.501 0.502 0.540 0.543 0.556 0.575 Mediana = promedio del 15° y 16° número = (0.453+0.457) /2 = 0.455 Primer cuartil = 0.25(n+1) = 0.25(30+1) = 7.75 (7° y 8°) = (0.427+0.430) /2 = 0.4285 13

Tercer cuartil = 0.75(n+1) = 0.75(30+1) = 23.25 (23° y 24°) = (0.482+0.489) /2 = 0.4855

Resumen estadístico para datos categóricos Parámetro: es una medición numérica que describe algunas características de una población. Dato estadístico: es una medición numérica que describe algunas características de una muestra. Una distribución de frecuencias (o tabla de frecuencias) indica cómo un conjunto de datos se divide en varias categorías (o clases) al listar todas las categorías junto con el número de valores de los datos que hay en cada una. La frecuencia de una clase en particular es el número de valores originales que caen en esa clase. La proporción muestral es la frecuencia dividida entre el tamaño de la muestra.

Con los datos de la población total de muestras de diámetros de fibras Stipa Ichu ejemplificaré un resumen estadístico para datos categórico. 0.344 0.348 0.352 0.372 0.416 0.416 0.427 0.430 0.430 0.434 0.444 0.444 0.445 0.446 0.453 0.457 0.459 0.468 0.469 0.473 0.482 0.482 0.482 0.489 0.501 0.502 0.540 0.543 0.556 0.575 Muestra = 30 probetas de fibras Stipa Ichu Categoría agrupada por el mismo ancho decimal, omitiendo las centésimas 0.30mm = 4 muestras 0.40mm = 20 muestras 0.50mm = 6 muestras Lo anterior, representa una frecuencia: 4, 6 y 20 Proporciones muestrales: 4/30=0.13 6/30=0.20 20/30=0.66

Resumen gráfico

Una gráfica adecuada permite representar un conjunto de datos que revele de manera clara algunas características importantes. Entre las diversas gráficas estadísticas encontramos las siguientes: Gráficas de tallo y hojas Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la hoja (el dígito del extremo derecho). Características de un diagrama de tallo y hojas: a) Muestra la forma de la distribución de los datos. b) Conserva los valores de los datos originales. c) Los datos muestrales aparecen ordenados. Ejemplo: Derivado del estudio de la influencia del tiempo de tratamiento alcalino en las fibras de ichu*, se obtuvieron los siguientes resultados de la prueba a tracción (Mpa): 26.674, 43.235, 51.781, 51.782, 51.782, 53.352, 61.194, 61.195, 64.333, 64.333, 64.335, 69.041, 69.042, 69.042, 78.454, 81.595, 86.301, 89.438, 91.008, 94.144, 103.562, 105.910, 122.389, 139.650. Tallo 2 4 5 6 7 8 9 10 12 13

Hoja 6.674 3.235 1.781, 1.782, 3.352 1.194, 1.195, 4.333, 4.333, 4.3335, 9.041, 9.042, 9.042, 8.454, 1.595, 6.301, 9.438 1.008, 4.144, 3.562, 5.910 2.389 9.650

* “Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA”, por los autores, Abel Gire Quispe y Alexander Giovani Caceres Lupaca.

Diagrama de puntos Una gráfica de puntos es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores. Los puntos que representan valores iguales se apilan. Es útil cuando el tamaño de la muestra no es demasiado grande y cuando la muestra contiene algunos valores repetidos. Figura 7. Diagrama de puntos de los ensayos de dureza Shore D de compuestos de fibra con biopólimeros*.

Fuente: Gráfico elaborado con MiniTab.

Histograma Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin espacios entre sí). La escala horizontal representa clases de valores de datos cuantitativos, en tanto que la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia. Usos importantes de un Histograma: Despliega visualmente la forma de la distribución de los datos. Muestra la ubicación del centro de los datos. Muestra la dispersión de los datos. Identifica los valores atípicos. Pasos para la construcción del Histograma: 1) En muchos casos es razonable tomar el número de intervalos de clase aproximadamente igual a la raíz cuadrada del tamaño de la muestra. 2)En la columna “Frecuencia”, se presentan los números de puntos de datos que están en cada uno de los intervalos de clase. 3) En la columna “Frecuencia relativa” se presentan las frecuencias divididas entre el número total de datos. Estas deberán de sumar 1. 4) La densidad representa la frecuencia relativa entre el ancho de la clase se ajusta esta tendencia. 5) Dibujar un rectángulo para cada clase, cuya altura sea igual a la densidad. 16

De la tesis titulada “Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de stipa ichu (pasto de paramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia”, por la autora, Gabriela Anabel Iza Tutillo, se realizaron los ensayos a flexión (Mpa) de 20 probetas y se obtuvieron los siguientes datos: 18519.81, 9430.55, 14291.19, 18212.06, 12102.84, 27240.404, 12335.802, 26286.125, 26021.262, 34385.869, 2916.04, 1795.46, 2694.68, 2770.94, 2929.65, 2672.51, 1910.27, 1705.20, 1705.20, 1676.60. Figura 8. Tabulación base del Histograma. Intervalo de resistencia a la flexión (Mpa) 1,676.60<1,910.27 1,910.27<2,929.65 2,929.65<18,519.81 18,519.81<34,385.869

Ancho de clase

Frecuencia

233.67 1,019.38 15,590.16 15,866.059

5 5 6 4 20

Frecuencia relativa 0.20000 0.20000 0.16667 0.25000 1

Densidad 0.04 0.04 0.027777778 0.0625

7 6 5 4

1,676.60 1,910.27

2,929.65

18,519.81

34,385.869

Fuente: Elaboración propia.

Un histograma es perfectamente simétrico si su mitad derecha es una imagen de espejo de su mitad izquierda. Los histogramas que no son simétricos se llaman sesgados. Un histograma con una cola larga a la derecha se dice que está sesgado a la derecha o positivamente sesgado. Un histograma largo con una cola larga a la izquierda se dice que está sesgado a la izquierda o negativamente sesgado. Se ha usado el término “moda” para referirnos al valor que ocurre con más frecuencia en una muestra. Este término también se usa en histogramas y otras curvas para referirse a un pico o máximo local. Un histograma es unimodal si tiene solamente un pico, o moda, y bimodal si tiene evidentemente dos modas distintas. 17

Diagrama de cajas Una gráfica de caja (o diagrama de caja y bigotes) es una gráfica de un conjunto de da-tos que consiste en una línea que se extiende desde el valor mínimo hasta el valor máximo, y una caja con líneas dibujadas en el primer cuartil Q1, la mediana y el tercer cuartil Q3. Procedimiento para elaborar una gráfica de caja: 1. Encuentre el resumen de 5 números (valor mínimo, Q1, Q2, Q3, valor máximo). 2. Construya un segmento de línea que se extienda desde el valor mínimo hasta el valor máximo de los datos. 3. Construya una caja (rectángulo) que se extienda de Q1 a Q3, y dibuje una línea en la caja sobre el valor de Q2 (la mediana). Ejemplo: Utilizando los datos de la primera muestra de diámetros de las fibras Ichu* se procede a realizar el diagrama de caja comparandola con una muestra de fibras de otra planta (Chilliwa). Figura 9. Diagrama de caja comparativos. # 1 2 3 4 5 6 7 8 9 10 Total

Stipa Ichu (mm) Chilliwa(mm) Muestra 1 Muestra 2 0.556 0.748 0.54 0.865 0.501 1.55 0.469 1.946 0.453 1.255 0.445 0.76 0.372 0.878 0.468 0.886 0.348 0.859 0.43 0.938 4.582 10.685

Fuente: Elaboración con MiniTab.

Diagrama de dispersión Un diagrama de dispersión es una gráfica de datos cuantitativos pareados (x, y), con un eje x horizontal y un eje y vertical. El eje horizontal se utiliza para la primera variable (x), y el eje vertical para la segunda variable. El patrón de los puntos graficados suele ser útil para determinar si existe una relación entre las dos variables.

Correlación de variables Existe una correlación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta. El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores cuantitativos pareados x y y en una muestra. También se conoce como coeficiente de correlación producto momento de Pearson, en honor de Karl Pearson (1857-1936), quien lo desarrolló originalmente. Puesto que el coeficiente de correlación lineal r se calcula utilizando datos muestrales, se trata de un estadístico muestral empleado para medir la fuerza de la correlación lineal entre x y y. Figura 10. Diagramas de dispersión.

Fuente: Gráfico tomado del libro Estadística por Triola.

Los valores del coeficiente de correlación cercanos a 1 o a -1 indican fuerte relación lineal; asimismo, valores cercanos a 0 indican débil relación lineal. Valores positivos del coeficiente de correlación indican que la recta de mínimos cuadrados tiene pendiente positiva, ello significa que valores mayores de una variable están asociados con valores mayores que los demás (directamente proporcional). Por el contrario, valores negativos del coeficiente de correlación indican que la recta de mínimos cuadrados tiene pendiente negativa, lo anterior muestra que valores mayores de una variable están relacionados con valores menores que los demás (inversamente proporcional).

Ejemplo: En el seminario de Sistemas de Materiales Emergentes se realizó un prototipo de enfriamiento pasivo. El sistema consta de un Muro Trombe a base de cartón corrugado como elemento principal de toda la estructura, en el interior se encuentran 16 latas de aluminio recicladas pintadas de color negro en aerosol y cubiertas de una placa de plástico microcorrugado opaco, todo lo anterior sellado con silicón de uso general para evitar salidas de aire. El objetivo es reducir la temperatura del espacio adiabático mediante la aplicación del principio termodinámico , el cual cons iste en utilizar la radiación solar para generar un movimiento c onvectivo en la cavidad entre el vidrio y las latas de al u minio al interior de l muro T rombe , lo que propicia un desplazamiento del volumen de aire caliente del interior hacia el exterior por medio de este muro/ chimenea.

Fuente: Fotografías elaboración propia.

Por lo anterior, se observó una correlación entre la temperatura externa con la del interior del espacio. Puesto que al estar más caliente el ambiente se producía una disminución de temperatura en el interior. La muestra 01 son datos recopilados en la mañana, mientras que la muestra 02, son por la tarde. Figura 11. Tabulación de datos de temperatura. MUESTRA 1

X # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Horario

09:00:00 a. m. 09:15:00 a. m. 09:30:00 a. m. 09:45:00 a. m. 10:00:00 a. m. 10:15:00 a. m. 10:30:00 a. m. 10:45:00 a. m. 11:00:00 a. m. 11:15:00 a. m. 11:30:00 a. m. 11:45:00 a. m. 12:00:00 p. m. 12:15:00 p. m. 12:30:00 p. m. 12:45:00 p. m.

(X-Xmedia) (Y-Ymedia) (X-Xmedia)^2 (Y-Ymedia)^2 (X-Xmedia)/Sx (Y-Ymedia)/Sy

Temperatura Interior °C Temperatura Exterior °C

Sumatoria Promedio

28.3000

29.6000

-3.1787

-5.9500

10.1045

35.4025

-2.1959

-1.7278

3.7941

29.4000

31.6000

-2.0788

-3.9500

4.3212

15.6025

-1.4360

-1.1470

1.6472

30.1000

32.0000

-1.3787

-3.5500

1.9010

12.6025

-0.9524

-1.0309

0.9819

30.4000

32.7000

-1.0788

-2.8500

1.1637

8.1225

-0.7452

-0.8276

0.6167

31.4000

33.7000

-0.0787

-1.8500

0.0062

3.4225

-0.0544

-0.5372

0.0292

32.1000

34.1000

0.6213

-1.4500

0.3860

2.1025

0.4292

-0.4211

-0.1807

32.7000

38.6000

1.2213

3.0500

1.4915

9.3025

0.8436

0.8857

0.7472

33.6000

40.4000

2.1213

4.8500

4.4997

23.5225

1.4654

1.4084

2.0638

29.6000

34.4000

-1.8787

-1.1500

3.5297

1.3225

-1.2978

-0.3339

0.4334

31.5000

38.4000

0.0213

2.8500

0.0005

8.1225

0.0147

0.8276

0.0121

31.9000

38.7000

0.4213

3.1500

0.1775

9.9225

0.2910

0.9147

0.2662

32.2000

41.2000

0.7213

5.6500

0.5202

31.9225

0.4982

1.6407

0.8175

32.2000

40.2000

0.7213

4.6500

0.5202

21.6225

0.4982

1.3503

0.6728

32.6600

35.7000

1.1813

0.1500

1.3954

0.0225

0.8160

0.0436

0.0355

32.7000

33.4000

1.2213

-2.1500

1.4915

4.6225

0.8436

-0.6243

-0.5267

32.9000

34.1000

1.4213

-1.4500

0.9818

-0.4211

503.6600

568.8000

31.4788

35.5500

1.495066888

3.556590127

r (Coef. de Co.)

0.687298519

2.0200

2.1025

33.5284

189.7400

1.44759229

3.443653583

Horario

Temperatura Interior °C

(X-Xmedia) (Y-Ymedia) (X-Xmedia)^2

(Y-Ymedia)^2

-0.4134 10.9968

MUESTRA 2 X #

((X-Xmedia)/Sx) ((Y-Ymedia)/Sy)

(X-Xmedia)/Sx (Y-Ymedia)/Sy

((X-Xmedia)/Sx) ((YYmedia)/Sy)

Temperatura Exterior °C

01:00:00 p. m.

32.8000

37.3000

-0.3562

2.1625

0.1269

4.6764

-0.6274

0.7862

-0.4933

01:15:00 p. m.

32.8000

43.0000

-0.3562

7.8625

0.1269

61.8189

-0.6274

2.8586

-1.7934

01:30:00 p. m.

33.2000

39.0000

0.0438

3.8625

0.0019

14.9189

0.0770

1.4043

0.1082

01:45:00 p. m.

33.8000

37.5000

0.6438

2.3625

0.4144

5.5814

1.1336

0.8590

0.9738

02:00:00 p. m.

34.4000

35.7000

1.2438

0.5625

1.5469

0.3164

2.1903

0.2045

0.4479

02:15:00 p. m.

34.1000

35.2000

0.9438

0.0625

0.8907

0.0039

1.6620

0.0227

0.0378

02:30:00 p. m.

33.3000

34.6000

0.1438

-0.5375

0.0207

0.2889

0.2531

-0.1954

-0.0495

02:45:00 p. m.

33.3000

34.6000

0.1438

-0.5375

0.0207

0.2889

0.2531

-0.1954

-0.0495

03:00:00 p. m.

32.9000

33.8000

-0.2562

-1.3375

0.0657

1.7889

-0.4513

-0.4863

0.2194

03:15:00 p. m.

33.2000

33.6000

0.0438

-1.5375

0.0019

2.3639

0.0770

-0.5590

-0.0431

03:30:00 p. m.

33.3000

0.1438

-1.8375

0.0207

3.3764

0.2531

-0.6681

-0.1691

03:45:00 p. m.

33.2000

33.6000

0.0438

-1.5375

0.0019

2.3639

0.0770

-0.5590

-0.0431

04:00:00 p. m.

33.0000

33.3000

-0.1562

-1.8375

0.0244

3.3764

-0.2752

-0.6681

0.1838

04:15:00 p. m.

32.7000

-0.4562

-2.4375

0.2082

5.9414

-0.8035

-0.8862

0.7120 1.3255

04:30:00 p. m.

32.4000

-0.7562

-2.7375

0.5719

7.4939

-1.3318

-0.9953

04:45:00 p. m.

32.1000

32.6000

-1.0562

-2.5375

1.1157

6.4389

-1.8601

-0.9226

530.5000

562.2000

5.1594

121.0375

0.567856441

2.750426103

Sumatoria Promedio S r (Coef. de Co.)

33.1563

35.1375

0.58647961

2.840627865

1.7161 3.0837

0.192730524

Fuente: Elaboración propia.

1. Ambas muestras no presentan una buena correlación. 2. La muestra 01 tiende a inclinarse hacia arriba y a la derecha, lo que indica una asociación en la recta positiva. Sin embargo, no alcanza una correlación de 1. 4. En el caso de la muestra 02, los datos se muestran bastante dispersos y su recta no tiene casi nada de pendiente. 5. En el caso de la muestra 01, los datos atípicos pueden ser por los cambios bruscos de temperatura o errores al momento de la medición. 21

Figura 12. Gráficas de dispersión.

Fuente: Elaborado con programa MiniTab.

Recta de los mínimos cuadrados Existe una correlación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta. El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores cuantitativos pareados x y y en una muestra. También se conoce como coeficiente de correlación producto momento de Pearson, en honor de Karl Pearson (1857-1936), quien lo desarrolló originalmente. Puesto que el coeficiente de correlación lineal r se calcula utilizando datos muestrales, se trata de un estadístico muestral empleado para medir la fuerza de la correlación lineal entre x y y. Figura 13. Gráfica de dispersión

Fuente: Elaboración con programa MiniTab.

El coeficiente de determinación es la cantidad de variación en y que se explica por la recta de regresión. Se calcula como:

De la tesis titulada “Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de stipa ichu (pasto de paramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia”, por la autora, Gabriela Anabel Iza Tutillo, se realizaron los ensayos a tracción de 15 probetas de biocompuestos a base de Stipa Ichu, Algodón y PLA, con una relación 70%/30% de matriz/refuerzo y un proceso de secado al natural, de la muestra 01 se procesaron los datos para obtener su recta de los mínimos cuadrados: Figura 14. Tabulación de datos deforación/esfuerzo a tracción. MUESTRA 1

X #

Ancho de probeta (mm) Deformación Unitaria

(Xi-media) (Yi-media) Producto (X)(Y)

(Xi-media)2

Y circunflejo

Esfuerzo Máximo a Tracción (Mpa)

25.000

0.0149

6.7900

-0.0009

-1.5680

0.0015 0.00000087111

7.544289951 -0.7543

24.910

0.0142

6.5200

-0.0016

-1.8380

0.0030 0.00000266778

6.934007414 -0.4140 14.95486361 1.2551

24.750

0.0234

16.2100

0.0076

7.8520

0.0594 0.00005725444

25.000

0.0158

8.5800

0.0000

0.2220

0.0000 0.00000000111

8.328938927 0.2511

25.000

0.0152

9.1200

-0.0006

0.7620

-0.0005 0.00000040111

7.805839609 1.3142

24.900

0.0130

6.1900

-0.0028

-2.1680

0.0061 0.00000802778

5.887808779 0.3022

24.780

0.0120

4.6000

-0.0038

-3.7580

0.0144 0.00001469444

5.015976583 -0.4160 5.015976583 1.1440

24.600

0.0120

6.1600

-0.0038

-2.1980

0.0084 0.00001469444

24.600

0.0150

5.9900

-0.0008

-2.3680

0.0020 0.00000069444

7.63147317 -1.6415

25.000

0.0130

6.5400

-0.0028

-1.8180

0.0052 0.00000802778

5.887808779 0.6522

24.860

0.0200

10.0200

0.0042

1.6620

0.0069 0.00001736111

11.99063415 -1.9706

24.900

0.0160

6.9000

0.0002

-1.4580

-0.0002 0.00000002778

8.503305366 -1.6033

25.250

0.0150

7.7800

-0.0008

-0.5780

0.0005 0.00000069444

7.63147317 0.1485

24.700

0.0200

11.4600

0.0042

3.1020

0.0129 0.00001736111

11.99063415 -0.5306

24.720

0.0180

12.5100

0.0022

4.1520

0.0090 0.00000469444

10.24696976 2.2630

Promedio

0.0158

8.3580

Fuente: Gráfico elaborado en Excel.

Sumatoria

0.1286 0.00014747333

Pendiente

871.8322

Intercepto

-5.446010

Por otro lado, en una segunda muestra se realizaron los ensayos a tracción de otras 15 probetas de biocompuestos a base de Stipa Ichu, Algodón y PLA, con una relación 70%/30% de matriz/refuerzo, sin embargo el proceso de secado en lugar de ser al natural tuvo un tratamiendo precocido, en esta segunda se procesaron los datos para obtener su recta de los mínimos cuadrados:

Figura 15. Tabulación de datos deforación/esfuerzo a tracción. MUESTRA 2

X #

Ancho de probeta (mm)

Deformación Unitaria

(Xi-media)

(Yi-media)

Producto (X)(Y)

(Xi-media)2

Y circunflejo

Esfuerzo Máximo a Tracción (Mpa)

24.800

0.0260

9.5800

0.0067

0.8156

0.0054

0.0000444444

12.61473943

-3.0347

24.970

0.0150

5.8500

-0.0043

-2.9144

0.0126

0.0000187778

6.261679373

-0.4117

24.800

0.0190

8.7800

-0.0003

0.0156

0.0000

0.0000001111

8.571883029

0.2081

25.000

0.0170

6.6200

-0.0023

-2.1444

0.0050

0.0000054444

7.416781201

-0.7968

25.000

0.0140

6.0400

-0.0053

-2.7244

0.0145

0.0000284444

5.68412846

0.3559

25.000

0.0240

12.9500

0.0047

4.1856

0.0195

0.0000217778

11.4596376

1.4904

24.750

0.0230

12.1400

0.0037

3.3756

0.0124

0.0000134444

10.88208668

1.2579

25.000

0.0240

10.8600

0.0047

2.0956

0.0098

0.0000217778

11.4596376

-0.5996 1.4353

24.900

0.0260

14.0500

0.0067

5.2856

0.0352

0.0000444444

12.61473943

24.840

0.0180

10.5100

-0.0013

1.7456

-0.0023

0.0000017778

7.994332115

2.5157

24.600

0.0200

8.1100

0.0007

-0.6544

-0.0004

0.0000004444

9.149433943

-1.0394 -1.5617

24.650

0.0150

4.7000

-0.0043

-4.0644

0.0176

0.0000187778

6.261679373

24.800

0.0180

8.8000

-0.0013

0.0356

0.0000

0.0000017778

7.994332115

0.8057

24.600

0.0140

6.6460

-0.0053

-2.1184

0.0113

0.0000284444

5.68412846

0.9619

-0.0023

0.0068

0.0000054444

7.416781201

-1.5868

0.1475

0.0002553333

24.760

0.0170

5.8300

Promedio

0.0193

8.7644

Fuente: Gráfico elaborado en Excel.

-2.9344 Sumatoria Pendiente

577.5509

Intercepto

-2.401584

Comparación de modelos Los modelos son una descripción esquemática (aproximada) de los sistemas y fenómenos (reales / naturales). Un modelo resultará útil en la medida en que sus propiedades tienen correspondencia con las del mundo real. La estrategia general de la modelación matemática que aquí se muestra consta de los siguientes pasos: Definición del problema y sus objetivos Definición de la teoría que gobierna el problema Descripción de la situación física en términos matemáticos Solución matemática del modelo. Comparación del modelo con la situación real. Estudio de las limitaciones del modelo. Aplicación del modelo e interpretación de los resultados que ofrece. Figura 16. Proceso de modelado.

Fuente: Gráfico tomado del artículo “Papel de la modelación matemática en la formación de los ingenieros Estadística” por Brito.

Cuando se tienen mas de un modelo para un mismo fenómeno o prueba se realiza un proceso de comparación de la “bondad” y ajuste del modelo a los valores “reales” (observados o medidos). La elección dependerá si el modelo es lo suficientemente “bueno” (preciso) para los propósitos de la investigación y al nivel que se busca. El error cuadrático medio (RMSE) mide la cantidad de error que hay entre dos conjuntos de datos. En otras palabras, compara un valor predicho y un valor observado o conocido.

Figura 17. Tabulación de datos deforación/esfuerzo a tracción para sacar el REMC. MUESTRA 1 X # 1

Ancho de probeta (mm)

Deformación Unitaria

25.000

(Xi-media)

(Yi-media)

Producto (X)(Y)

(Xi-media)2

Y circunflejo

ei2

Esfuerzo Máximo a Tracción (Mpa) 6.7900

-0.0009

-1.5680

7.544289951

-0.7543

0.56895333

24.910

0.0142

6.5200

-0.0016

-1.8380

0.0030

0.000002668

6.934007414

-0.4140

0.171402139

24.750

0.0234

0.0149

16.2100

0.0076

7.8520

0.0594

0.0015

0.000057254

0.000000871

14.95486361

1.2551

1.57536735

25.000

0.0158

8.5800

0.2220

0.0000

25.000

0.0152

9.1200

-0.0006

0.7620

-0.0005

0.000000401

7.805839609

1.3142

1.72701753

24.900

0.0130

6.1900

-0.0028

-2.1680

0.0061

0.000008028

5.887808779

0.3022

0.091319534

24.780

0.0120

4.6000

-0.0038

-3.7580

0.0144

0.000014694

5.015976583

-0.4160

0.17303652 1.308789578

0.0000

0.000000001

8.328938927

0.2511

0.063031662

24.600

0.0120

6.1600

-0.0038

-2.1980

0.0084

0.000014694

5.015976583

1.1440

24.600

0.0150

5.9900

-0.0008

-2.3680

0.0020

0.000000694

7.63147317

-1.6415

2.69443417

25.000

0.0130

6.5400

-0.0028

-1.8180

0.0052

0.000008028

5.887808779

0.6522

0.425353389

24.860

0.0200

10.0200

0.0042

1.6620

0.0069

0.000017361

11.99063415

-1.9706

3.88339895

-0.0002

0.000000028

8.503305366

-1.6033

2.570588096

6.9000

0.0002

-1.4580

25.250

0.0150

7.7800

-0.0008

-0.5780

0.0005

0.000000694

7.63147317

0.1485

0.02206022

24.700

24.900

0.0200

0.0160

11.4600

0.0042

3.1020

0.0129

0.000017361

11.99063415

-0.5306

0.281572600

24.720

0.0180

12.5100

0.0022

4.1520

0.0090

0.000004694

10.24696976

2.2630

Promedio

0.0158

8.3580

0.1286

0.000147473

Sumatoria Pendiente

871.8322

Intercepto

-5.446010

5.12130588

Promedio

1.37850873

Raíz

1.174099114

REMC%

14.04760845

MUESTRA 2 X #

Ancho de probeta (mm) Deformación Unitaria

(Xi-media)

(Yi-media)

Producto (X)(Y)

(Xi-media)2

Y circunflejo

ei2

Esfuerzo Máximo a Tracción (Mpa)

24.800

0.0260

9.5800

0.0067

0.8156

0.0054

0.0000

12.61473943

-3.0347

9.20964338

24.970

0.0150

5.8500

-0.0043

-2.9144

0.0126

0.0000

6.261679373

-0.4117

0.169479906

24.800

0.0190

8.7800

-0.0003

0.0156

0.0000

8.571883029

0.2081

0.04331267

25.000

0.0170

6.6200

-0.0023

-2.1444

0.0050

0.0000

7.416781201

-0.7968

0.634860282

25.000

0.0140

6.0400

-0.0053

-2.7244

0.0145

0.0000

5.68412846

0.3559

0.12664455

25.000

0.0240

12.9500

0.0047

4.1856

0.0195

0.0000

11.4596376

1.4904

2.221180090

10.88208668

1.2579

1.58234591

25.000

0.0240

10.8600

0.0047

2.0956

0.0098

0.0000

11.4596376

-0.5996

0.359565249

24.900

24.750

0.0260

0.0230

14.0500

12.1400

0.0067

0.0037

5.2856

3.3756

0.0352

0.0124

0.0000

12.61473943

1.4353

2.05997292

24.840

0.0180

10.5100

-0.0013

1.7456

-0.0023

0.0000

7.994332115

2.5157

6.328584908

24.600

0.0200

8.1100

0.0007

-0.6544

-0.0004

0.0000

9.149433943

-1.0394

1.08042292

24.650

0.0150

4.7000

-0.0043

-4.0644

0.0176

0.0000

6.261679373

-1.5617

2.438842465

24.800

0.0180

8.8000

-0.0013

0.0356

0.0000

7.994332115

0.8057

0.64910074

24.600

0.0140

6.6460

-0.0053

-2.1184

0.0113

0.0000

5.68412846

0.9619

0.925196860

24.760

0.0170

5.8300

-0.0023

-2.9344

0.0068

0.0000

7.416781201

Promedio

0.0193

8.7644

0.1475

0.0003

Sumatoria Pendiente

577.5509

Intercepto

-2.401584

-1.5868

2.51787458

Promedio

2.02313516

Raíz

1.422369559

REMC% 16.2289439

Fuente: Gráfico elaborado en Excel.

Gráfica de residuos

Una gráfica residual es un diagrama de dispersión de los valores (x, y) después de remplazar cada uno de los valores de la coordenada y por el valor del residuo y-y circunfleja (donde y circunfleja expresa el valor predicho de y). Es decir, una gráfica residual es una gráfica de los puntos (x, y-y circunfleja). Puede ser otra herramienta útil para analizar los resultados de correlación y regresión, así como para verificar los requisitos necesarios para hacer inferencias sobre la correlación y la regresión. La gráfica residual no debe tener ningún patrón obvio (ni siquiera un patrón en línea recta). (Esta ausencia de un patrón confirma que un diagrama de dispersión de los datos muestrales tiene un patrón en línea recta en vez de otro patrón). La gráfica residual no debe ser mucho más ancha (o más delgada) al recorrerla de izquierda a derecha. (Esto confirma el requisito de que para los diferentes valores fijos de x, las distribuciones de los valores y correspondientes tienen la misma desviación estándar). Cuando la dispersión vertical en un diagrama de dispersión no varía demasiado, se dice que el diagrama de dispersión es homoscedástico. Lo contrario de homoscedástico es heteroscedástico. Figura 18. Gráficas residuales.

Fuente: Gráfico tomado del libro Estadística por Triola.

Una gráfica de residuos que se ve bien no prueba por sí misma que el modelo lineal es adecuado, porque los supuestos del modelo lineal pueden fallar de otras maneras. Por otra parte, una gráfica de residuos con un defecto serio indica claramente que el modelo lineal es inadecuado. Transformación de variables

En general, sustituir una variable con una función de la misma se llama transformación de la variable. Específicamente, elevar una variable a una potenciase llama transformación potencia. En un diagrama de dispersión, un valor atípico es un punto que cae lejos de los demás puntos de datos. Los datos muestrales pareados pueden incluir uno o más puntos influyentes, que son puntos que afectan fuertemente la gráfica de la línea de regresión. Ejemplo: Gráficas de valores ajustados contra residuos de la Muesta 01. MUESTRA 1 TRANSFORMACIÓN X # 1

Ancho de probeta (mm) Deformación Unitaria

ei2

46.1041

-0.0009

0.0304 0.000000871

62.27436338

-16.1703

261.47741762

24.910

0.0142

6.5200

42.5104

-0.0016

-36.1972

0.0591 0.000002668

49.94947091

-7.4391

55.339775950

24.750

0.0234

16.2100

262.7641

0.0076

184.0565

1.3927 0.000057254

211.9337719

50.8303 2583.72225236

0.0158

6.7900

25.000

0.0149

(Xi-media) (Yi-media) Producto (X)(Y) (Xi-media)2 Y circunflejo

Esfuerzo Máximo a Tracción (Mpa)

3 4

25.000

Esfuerzo Máximo a Tracción (Mpa)

8.5800

73.6164

0.0000

-32.6035

-5.0912

0.0002 0.000000001

78.12065369

-4.5043

25.000

0.0152

9.1200

83.1744

-0.0006

4.4668

-0.0028 0.000000401

67.55646015

15.6179

243.92004524

24.900

0.0130

6.1900

38.3161

-0.0028

-40.3915

0.1144 0.000008028

28.82108382

9.4950

90.155332312

4.6000

21.1600

-0.0038

-57.5476

24.780

0.0120

0.2206 0.000014694

11.21409458

24.600

0.0120

6.1600

37.9456

-0.0038

-40.7620

0.1563 0.000014694

11.21409458

24.600

0.0150

5.9900

35.8801

-0.0008

-42.8275

0.0357 0.000000694

64.0350623

-0.0028

792.70190207

0.0130

6.5400

42.7716

0.1018 0.000008028

28.82108382

13.9505 194.616901767

24.860

0.0200

10.0200

100.4004

0.0042

21.6928

0.0904 0.000017361

152.0700085

-51.6696 2669.74844297

24.900

0.0160

6.9000

47.6100

0.0002

-31.0976

-0.0052 0.000000028

81.64205154

-34.0321 1158.180532032

60.5284

-0.0008

-18.1792

25.250

0.0150

7.7800

-35.9360

98.92103470

26.7315 714.573382223 -28.1550

12 13

25.000

9.9459

20.288301322

0.0151 0.000000694

64.0350623

24.700

0.0200

11.4600

131.3316

0.0042

52.6240

0.2193 0.000017361

152.0700085

-20.7384 430.081587284

24.720

0.0180

12.5100

156.5001

0.0022

77.7925

0.1686 0.000004694

116.85603

39.6441 1571.65228441

Promedio

0.0158

8.3580

78.7076

Sumatoria

2.5966 0.000147473

Pendiente

17606.9892

Intercepto

-200.069776

-3.5067

12.29668048

Promedio

726.51172485

Raíz

26.95388144

Fuente: Gráfico elaborado con Excel.

La gráfica de residuos no presenta una tendencia perceptible, es casi homoscedástica, aunque la maoria de los datos se aglomeran de un lado. Se puede observar un dato atípico en la esquina superior derecha. Pareciera un modelo creible, pero se puede realizar otra transformación de potencia pero ahora en las x. 30

Bibliografía

Bernal Torres, C. A., Cruz Buelvas, L. E., & Fernandez Palma, O. (2014). Metodología de la investigación: Administración, economía, humanidades y ciencias sociales (Cuarta edición). http://pbidi.unam.mx:8080/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=cat02025a&AN=lib.MX001001976565&lang=es&site=e ds-live Brito-Vallina, M. L., Alemán-Romero, I., Fraga-Guerra, E., Para-García, J. L., & Arias-de Tapia, R. I. (2011). Papel de la modelación matemática en la formación de los ingenieros. Ingeniería Mecánica, 14(2), 129-139. Diseños factoriales y factoriales fraccionados. (s. f.). [Mtbconcept]. Recuperado 14 de junio de 2021, de https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/doe/supporting-topics/factorial-and-screening-designs/factorial-andfractional-factorial-designs/ Gire Quispe, A., & Caceres Lupaca, A. G. (2019). Evaluación de la influencia del tratamiento superficial sobre el comportamiento mecánico de fibras de ichu en biocompuestos a base de PLA. Universidad Nacional de San Agustín de Arequipa. http://repositorio.unsa.edu.pe/handle/UNSA/11140 Hernández-Sampieri, R., & Mendoza Torres, C. P. (2018). Metodología de la investigación: Las rutas cuantitativa, cualitativa y mixta. McGraw-Hill Interamericana. http://ebookcentral.proquest.com/lib/bibliodgbsp/detail.action?docID=5485814 Montero Lorenzo, J. M. (2007). Estadística descriptiva. Paraninfo; Gale eBooks. http://link.gale.com/apps/pub/3BCM/GVRL?sid=bookmark-GVRL

Triola, M. F., Pineda Ayala, L. E., & Triola, M. F. (2013). Estadística (Decimoprimera edición). Pearson. http://pbidi.unam.mx:8080/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=cat02025a&AN=lib.MX001001976387&lang=es&site=e ds-live

Tutillo, I., & Anabel, G. (2017). Caracterización mecánica del material compuesto de matriz epoxi reforzada con fibra vegetal (algodón) y fibra natural de STIPA ICHU (pasto de páramo) con secado natural y precocido para determinar propiedades mecánicas en la fabricación de elementos livianos de alta resistencia. https://repositorio.uta.edu.ec:8443/jspui/handle/123456789/26085