U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Programa de la asignatura:
Ingeniería de bioprocesos II
U2
Estadística aplicada a la investigación
Universidad Abierta y a Distancia de México
0
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Índice Presentación de la unidad..……………………………………………………………………….2 Propósito…………………………………………………………………………………………….2 Competencia específica…………………………………………………………………………...3 Temario……………………………………………………………………………………………...3 2.1. Estadística descriptiva………………………………………………………………………..4 2.1.1. Parámetros de modelos estadísticos……………………………………………………..5 2.1.2. Modelos estadísticos…………………………………………………………………….....8 2.2. Estadística inferencial…………………………………………………………………….…19 2.2.1. Análisis factorial……………………………………………………………………………21 2.2.2. Interpretación, análisis y proyección de factores………………………………………23 Actividades………………………………………………………………………………………...24 Autorreflexiones…………………………………………………………………………………...25 Cierre……………………………………………………………………………………………….25 Fuentes de consulta………………………………………………………………………………26
Universidad Abierta y a Distancia de México
1
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Presentación de la unidad El propósito de la unidad 2 es mostrar el lenguaje estadístico requerido en los procedimientos de las investigaciones en un nivel formal de tal forma que el alumno comprenda la importancia y el sentido de usar este leguaje matemático ya que es la forma reconocida por los centros de investigación a nivel internacional, la homologación que ha logrado la estadística en el manejo de las investigaciones ha logrado una verdadera y completa transmisión del conocimiento adquirido a través de los proyectos de investigación, mostrando las limitaciones y circunstancias pero también las proyecciones y probabilidades del proyecto, es importante denotar que los resultados siempre serán marginales y con una probabilidad de error establecida pero el investigador encuentra muy útil esta información ya que puede ayudarle al comprender los mecanismos, las mejores rutas y a evitar nuevos errores partiendo de la base de los errores presentados. La estadística usada en la investigación tiene un grado de estado del arte ya que los investigadores tendrán que descubrir, proponer e inventar rutas y procesos para llegar a su meta, la estadística le puede ayudar a elegir las mejores rutas que comprendan un desempeño sustentable en el resultado.
Propósito
Construir modelos estadísticos a partir de información cuantitativa y no cuantitativa. Estimar modelos descriptivos respecto a los casos estudiados. Utilizar los conceptos de multifactorialidad para explicar fenómenos complejos.
Universidad Abierta y a Distancia de México
2
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Competencia específica
Aplicar el lenguaje estadístico en el desarrollo de una investigación biotecnológica para sustentar comportamiento del modelo, al mismo tiempo, crear modelos capaces de funcionar en escenarios a futuro mediante el análisis de ejemplos representativos.
Temario 2. Estadística aplicada a la investigación 2.1. Estadística descriptiva 2.1.1. Parámetros de modelos estadísticos 2.1.2. Modelos estadísticos 2.2. Estadística inferencial 2.2.1. Análisis factorial 2.2.2. Interpretación, análisis y proyección de factores
Universidad Abierta y a Distancia de México
3
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
2.1. Estadística descriptiva La estadística es una herramienta que ha tenido un crecimiento histórico en versatilidad y contenidos; hoy, como un connotado acuerdo se ha determinado que la estadística se divide por su aplicación en dos partes: la estadística descriptiva y la estadística inferencial, la primera se encarga de transformar los fenómenos, situaciones y procesos que se efectúan en la naturaleza o en procesos realizados por grupos específicos en un lenguaje matemático que nos permita encontrar patrones y tendencias de comportamiento, es decir, convertimos la información en un modelo estadístico. Un modelo estadístico es la representación de un proceso que permite comprender su comportamiento en situaciones dinámicas, es decir a través del tiempo, por ejemplo, un modelo se puede referir al ritmo de crecimiento de una colonia de microorganismos bajo ciertas condiciones o a las tendencias de alimentación de un grupo en particular de aves durante sus migraciones anuales. Los elementos que se involucran en los modelos estadísticos se llaman factores, que son las variables que contribuyen al desarrollo del proceso en estudio, algunas veces los factores son evidentes, otras no tanto. Es necesario hacer estudios contemplados en la estadística para determinar el grado con que los factores propuestos realmente intervienen en el problema o situación estudiada. Los modelos también se conocen como funciones de distribución. Para conocer más acerca del tema, te sugerimos la lectura de los siguientes recursos: Este recurso muestra un compendio general de la probabilidad y estadística. UNAM (2013). Estadística básica. México. Recuperado de: http://arquimedes.matem.unam.mx/lite/2013/1.1_Un100/Probabilida dYEstadistica.html Video que habla sobre las fuertes relaciones entre la biotecnología y el uso de la estadística. UNADN (2010). La estadística y la biotecnología. México. Recuperado de: http://youtu.be/BalnV5zp_tE
Universidad Abierta y a Distancia de México
4
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Las principales formas o tipos de distribución que se manejan en la estadística general. SERGAS (2006). Tipos de distribuciones. España. Recuperado de: http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/4ayuda%20Distribuciones%20de%20probabilidad.pdf Importancia del diseño de experimentos en las primeras etapas del manejo de datos experimentales. Universidad Nacional de Lujan (2009). Diseño de experimentos. Argentina. Recuperado de: http://www.unlu.edu.ar/~estadistica/Diseno_de_experimentos.pdf
2.1.1. Parámetros de modelos estadísticos Los parámetros son las variables que están presentes y que indican las características particulares de un modelo estadístico, existen varias definiciones y conceptos que son necesarios conocer.
Definiciones Básicas Variable respuesta: es la variable en estudio, aquella cuyos cambios se desean estudiar. Es la variable dependiente. Factor: es la variable independiente. Es la variable que manipula el investigador, para estudiar sus efectos sobre la variable dependiente. Nivel del factor: es cada una de las categorías, valores o formas específicas del factor. Factor cualitativo: sus niveles se clasifican por atributos cualitativos. Factor cuantitativo: sus niveles son cantidad numérica en una escala. Factores observacionales: El investigador registra los datos pero no interfiere en el proceso que observa. Factores experimentales: El investigador intenta controlar completamente la situación experimental. Universidad Abierta y a Distancia de México
5
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Experimento unifactorial: es aquel en el que se estudia un solo factor. Experimento multifactorial: es aquel en el que se estudia simultáneamente más de un factor. Tratamiento: Conjunto de condiciones experimentales que serán impuestas a una unidad experimental en un diseño elegido. En experimentos unifactoriales, un tratamiento corresponde a un nivel de factor. En experimentos multifactoriales, un tratamiento corresponde a la combinación de niveles de factores. Unidad experimental: es la parte más pequeña de material experimental expuesta al tratamiento, independientemente de otras unidades. Error experimental: Describe la variación entre las unidades experimentales tratadas de forma idéntica e independiente. Orígenes del error experimental:
Variación natural entre unidades experimentales Variabilidad en la medición de la respuesta Imposibilidad de reproducir idénticas condiciones del tratamiento de una unidad a otra Interacción de tratamientos con unidad experimental Cualquier factor externo
Tratamiento de control: Un control al que no se le aplica tratamiento revelará las condiciones en que se realiza el experimento. Mediciones: Son los valores de la variable dependiente, obtenidos de las unidades experimentales luego de la aplicación de tratamientos. Tipos de variables: Al conjunto de los distintos valores numéricos que adopta una variable o factor se llama variable estadística. Las variables pueden ser de dos tipos:
Variables cualitativas o categóricas: no se pueden medir numéricamente (por Ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Universidad Abierta y a Distancia de México
6
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por Ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen información sobre dos características de la población (por Ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen información sobre tres o más características (por Ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h... etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo. Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
Las variables aleatorias son variables que son seleccionadas al azar o por procesos aleatorios. La estadística descriptiva se basa en dos grupos de variables que dan forma a un modelo estadístico, el primer grupo se llama “Medidas de tendencia central” el segundo son las “Medidas de dispersión”.
Universidad Abierta y a Distancia de México
7
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
2.1.2. Modelos estadísticos En todos los modelos estadísticos hay seis variables básicas que los definen, las tres primeras corresponden a la medida de tendencia central y las tres siguientes a las de medidas de dispersión, en conjunto las seis medidas dan una imagen de las características estadísticas particulares del proceso lo que permite comenzar a tomar decisiones de inmediato y programar las pruebas y formas de trabajo más adecuadas según el tipo de modelo que se representará. Medidas de tendencia central. Media, mediana y moda
Figura 1. Imagen de medidas de tendencia central: http://probabilidadyestadisticadinamica.bligoo.com.mx/media/users/19/971663/images/public/22465 7/estadiistiica.gif?v=1332386445282
Las medidas de tendencia central: son tres; media, mediana y moda, sus definiciones son: Media es equivalente al promedio aritmético de un grupo. La mediana es la media geométrica del grupo y la moda se establece en base a los valores más repetidos. Las medidas de tendencia central establecen el eje central del modelo, sirven para ubicar a qué tipo de modelo estadístico pertenece la muestra en estudio.
Media aritmética La media aritmética de n valores, es igual a la suma de todos ellos dividida entre n. Se denota por x.
Universidad Abierta y a Distancia de México
8
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Esto es:
Cuando los datos tienen más de una frecuencia, para obtener la media aritmética se agrega otra columna a la tabla estadística con el producto de las observaciones y sus frecuencias. Es decir, si se cuenta con una distribución de datos entonces se aplica la fórmula:
Ejemplo: Con los datos: 10, 8, 6, 15, 10, 5, hallar la media aritmética. Solución:
Ejemplo: Mediante la siguiente distribución de frecuencias que muestra las estaturas en metros de los alumnos de un grupo de la Facultad de Contaduría y Administración, hallar la media aritmética.
Universidad Abierta y a Distancia de México
9
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Solución: se construye una tabla para incluir el cálculo de la frecuencia:
Las características de la media aritmética son:
Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas. En su cálculo se toman en cuenta todos los valores de la variable. Es lógica desde el punto de vista algebraico. La media aritmética es altamente afectada por valores extremos. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y sólo una media aritmética.
Mediana La mediana es el punto central de una serie de datos ordenados de forma ascendente o descendente. De acuerdo al número de casos o datos, hay dos formas para calcular la mediana: para número impar y para número par:
Universidad Abierta y a Distancia de México
10
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Número impar de datos ordenados de menor a mayor o de mayor a menor: la mediana es el valor que queda justo al centro. Ejemplo: Obtener la mediana de los siguientes datos: 4, 7, 1, 9, 2, 5, 6. Solución: Ordenando de forma ascendente: 1, 2, 4, 5, 6, 7, 9. El valor que queda al centro es el 5, porque hay tres datos antes y tres datos después de él, entonces la mediana es 5.
Número de datos par: en este caso se busca la media aritmética entre los dos valores centrales. Ejemplo: Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2. Solución: Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18. Los valores centrales son 4 y 5. Su media aritmética es:
En este caso, la mediana de este conjunto no pertenece al conjunto de datos. Las características de la mediana son:
En su cálculo no se incluyen todos los valores de la variable. La Mediana no es afectada por valores extremos. Puede ser calculada en distribuciones de frecuencia con clases abiertas. No es lógica desde el punto de vista algebraico.
Universidad Abierta y a Distancia de México
11
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Moda La moda de un conjunto de datos numéricos es el valor que más se repite, es decir, el que tiene el mayor número de frecuencias absolutas. La moda puede ser no única e inclusive no existir. La moda es una medida de tendencia central muy importante, porque permite planificar, organizar y producir para satisfacer las necesidades de la mayoría. Ejemplo: Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1. Solución: Ordenando de forma ascendente: -3, -2, -2, -2, -1, 0, 0, 1, 3, 3, 4, 5. El valor que más se repite es el -2, por lo tanto ese valor es su moda. Ejemplo: Obtener la moda de los siguientes datos: 6, 2, -1, -5, 3, -3, -2, 5, 0, -4, 4, 1. Solución: Ordenando de forma ascendente: -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6. Ningún valor se repite es, decir su moda no existe. Ejemplo: en una tienda, 18 empleados presentan la siguiente información:
¿Cuál es la moda de las horas laboradas por los empleados? Solución: Hay dos valores con frecuencia 5. Entonces, se concluye que hay más de una moda. La mayor frecuencia son 8 y 9 horas diarias de trabajo. Universidad Abierta y a Distancia de México
12
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Las características de la moda son:
En su cálculo no se incluyen todos los valores de la variable. El valor de la moda puede ser afectado grandemente por el método de designación de los intervalos de clases. No está definida algebraicamente. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. No es afectada por valores extremos.
Existen algunas variantes que son útiles cuando hay factores adicionales que afectan considerablemente los cálculos, entre los más usuales tenemos: La media ponderada de un conjunto de valores de una variable x a los que se han asignado, respectivamente, una ponderación se calcula mediante la fórmula:
Los valores p1, p2 y p3 indican la importancia o peso que se da a cada variable correspondiente. Ejemplo: Un profesor decide que la calificación final de un alumno constará del 60% del promedio de los exámenes, el 30% de promedio de tareas y el 10% de participación en clase a lo largo del año escolar. Si un alumno tiene 5.3 de promedio de exámenes, 7.1 de tareas y 7.8 promedio de participaciones. ¿Cuál será su calificación final?
Si el profesor sólo tomara en cuenta los exámenes, el alumno no aprobaría. Sin embargo al darle importancia a las tareas y a su participación en clase, esto hace que al final consiga aprobar con la media ponderada.
Universidad Abierta y a Distancia de México
13
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Su característica principal es que su resultado depende de la importancia o “peso” de cada uno de los valores asignado por quien efectúa el cálculo. La media geométrica de un conjunto de n observaciones es la raíz enésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas:
Ejemplo: Obtener la media geométrica de los datos: 3, 8, 9.
Ejemplo: Las siguientes temperaturas han sido tomadas de un experimento químico: 13.4°C, 12.8°C, 11.9°C, 13.6°C. Determinar la temperatura geométrica media de este proceso.
Las características de la media geométrica son:
Se toman en cuenta todos los valores de la variable. Es afectada por valores extremos aunque en menor medida que la media aritmética. Si un dato es cero, su resultado será cero. No puede ser calculada en distribuciones con clase abiertas. Es mayormente usada para promediar tasas de intereses anuales, inflación razones y valores que muestren una progresión geométrica (efecto multiplicativo sobre el de los años anteriores).
Universidad Abierta y a Distancia de México
14
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Medidas de dispersión La dispersión mide que tan alejados están un conjunto de valores respecto a su media aritmética. Así, cuanto menos disperso sea el conjunto, más cerca del valor medio se encontrarán sus valores. Este aspecto es de vital importancia para el estudio de investigaciones. Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas.
Rango El rango de una distribución es la diferencia entre el valor máximo (M) y el valor mínimo (m) de la variable estadística. Para su cálculo, basta con ordenar los valores de menor a mayor m de M.
Ejemplo: Si se conoce que el valor promedio de días de espera para obtener una licencia de manejo, es de 5 días en la oficina A, y de 7 días en la oficina B, con esta única Universidad Abierta y a Distancia de México
15
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
información no es posible hacer una elección adecuada. Sin embargo, si se sabe que en la oficina A, el número mínimo de días de espera es de 3 y el máximo de 15, mientras que en la oficina B, los valores son 3 y 8 días respectivamente, se podrá tomar una decisión más adecuada para acudir a obtener la licencia, gracias a esta información adicional.
Características del rango:
A medida que el rango es menor, el grado de representatividad de los valores centrales se incrementa. A medida que el rango es mayor, la distribución está menos concentrada o más dispersa. Su cálculo es extremadamente sencillo. Tiene gran aplicación en procesos de control de calidad. Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado.
Varianza: La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto, menor representatividad tendrá la media aritmética. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado. La varianza de un conjunto de datos se define como el cuadrado de la desviación estándar y está dada por: ν = σ2 Ejemplo: Hallar la varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7 Solución:
Universidad Abierta y a Distancia de México
16
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Desviación estándar La desviación estándar o desviación típica se define como la raíz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media. Esto es la raíz cuadrada de la varianza:
La desviación estándar es una medida estadística de la dispersión de un grupo o población. Una gran desviación estándar indica que la población se encuentra muy dispersa respecto de la media. Una desviación estándar pequeña indica que la población está muy compacta alrededor de la media. Para el caso de datos agrupados, la desviación estándar se calcula por medio de:
Universidad Abierta y a Distancia de México
17
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Ejemplo: Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.
Solución: Calculando los puntos medios de cada clase y obteniendo f *x:
Sustituyendo en las formulas generales el valor de la desviación estándar es:
Y el de la varianza:
Universidad Abierta y a Distancia de México
18
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
2.2. Estadística inferencial ¿Cuándo es necesaria la estadística inferencial? Cuando queremos hacer alguna afirmación sobre más elementos de los que vamos a medir. La estadística descriptiva, como indica su nombre, tiene por finalidad describir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de personas, la estadística descriptiva nos puede ayudar. Lo primero será tomar medidas en todos los miembros del grupo, de esos aspectos o variables para, posteriormente, indagar en lo que nos interese. Por ejemplo, para saber cuál es la “edad del grupo”, podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice, aproximadamente, alrededor de qué edad se sitúan todos. Ya sabemos, pongamos, que la edad media es 40 años. Pero además podemos utilizar la desviación típica, si queremos saber si el grupo tiene edades muy dispares (por ejemplo, una desviación típica de 12 años) o si, por el contrario, tienen edades parecidas (una desviación típica de 2 años). Sólo con esos indicadores ya podemos hacernos una idea, podemos describir a ese conjunto de personas, al menos en referencia a su edad. Pero el tamaño de los grupos que suelen interesar es demasiado grande, a veces tan grade como “todo el mundo”. Y esto, más que ser una rareza, es en muchos campos la norma. Por ejemplo, cuando se afirma que las personas tenemos una agudeza visual menor que la de los halcones, podemos estar seguros de que no hemos medido la agudeza visual de todos los humanos ni la de todos los halcones. Pues bien, la estadística inferencial es la que va a permitir dar ese salto de los resultados obtenidos para un grupo a la totalidad. Planteemos una cuestión concreta: Un profesor de estadística afirma que se Aprende mejor estadística inferencial utilizando los ordenadores para mostrar lo que se estudia. ¿Cómo podemos decidir si esta afirmación es cierta? Una posible forma sería seleccionando dos grupos de alumnos (equivalentes) que estudien estadística inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idénticos ejercicios, etc., excepto que uno de ellos utilizan los ordenadores en su aprendizaje y otro no. Universidad Abierta y a Distancia de México
19
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Veamos las definiciones o parámetros relacionados con la estadística en relación a este ejemplo, suponiendo que realizamos el estudio con los alumnos de los grupos F (con ordenador) y G (sin ordenador):
Para complementar el aprendizaje de este tema, te pedimos revisar los siguientes videos: Una excelente presentación básica de la inferencia estadística, la cual sirve para ver comportamientos futuros en base a las tendencias. Medina Gual, Luis (Septiembre, 2013). Introducción a la inferencia estadística. Universidad Anáhuac. Recuperado de: http://youtu.be/RNVSr18Xz7s
Universidad Abierta y a Distancia de México
20
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Una clara explicación sobre la media, mediana y moda conocidas como de tendencia central. Medina Gual, Luis (Febrero, 2013). Medidas de tendencia central. Universidad Anáhuac. Recuperado de: http://youtu.be/2E-nSR8q6KI Explicación sobre el rango, la varianza y la desviación estándar conocidas como medidas de dispersión. Medina Gual, Luis (Marzo, 2012). Medidas de dispersión. Universidad Anáhuac. Recuperado de: http://youtu.be/o5bq8jRuq5E Una muestra de la forma en que se puede aplicar el teorema de límite central a la biotecnología. Barón López, Francisco Javier (Mayo, 2012). Bioestadística: teorema del límite central. Universidad de Málaga. Recuperado de: http://youtu.be/xZmFqLHIFJk Introducción a la comprensión y uso de los intervalos de confianza, conceptos de error. Hernández, Evelio (Septiembre, 2012). Intervalos de confianza. México, recuperado de: http://youtu.be/EsAGiLv8qVE Conceptos y usos dentro de las pruebas de investigación de las hipótesis. Monardes, Carlos (Noviembre, 2012). Pruebas de hipótesis. México, recuperado de: http://youtu.be/oBImHXNU41Q
2.2.1. Análisis factorial El análisis factorial es una técnica estadística multivariante cuyo principal propósito es sintetizar las interrelaciones observadas entre un conjunto de variables en una forma concisa y segura como una ayuda a la construcción de nuevos conceptos y teorías. Para ello utiliza un conjunto de variables aleatorias inobservables, que llamaremos factores comunes, de forma que todas las covarianzas o correlaciones son explicadas por dichos Universidad Abierta y a Distancia de México
21
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
factores y cualquier porción de la varianza inexplicada por los factores comunes se asigna a términos de error residuales que llamaremos factores únicos o específicos. Un ejemplo de un sistema multifactorial:
Figura 2. Ejemplo de un sistema multifactorial (http://www.medicinabc.com/2013/10/sistema-reninaangiotensina-aldosterona.html#axzz37Zq1lmwS).
Para complementar el aprendizaje de este tema, te pedimos revisar los siguientes videos:
Universidad Abierta y a Distancia de México
22
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Una visión clara del uso del diseño factorial. Silva, Edgar (Abril, 2013). Diseño factorial. México, recuperado de: http://youtu.be/bMU8oDYKOhM
Una visión de los diseños experimentales aplicados a la Odontología. Arriola Guillen, Luis Ernesto (septiembre, 2012). Diseño Experimental. México, recuperado de: http://youtu.be/HBWg8EMj7AM Una introducción al manejo del programa SPSS. Ruiz, Miguel Ángel, Pardo, Antonio (Enero, 2001). Análisis factorial con SPSS. Universidad Complutense de Madrid, recuperado de: (http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_depart amento/materiales/analisis_datosyMultivariable/20factor_SPSS.pdf)
2.2.2. Interpretación, análisis y proyección de factores Como un ejercicio de deducción, trata de identificar el sentido de los dos factores que se ilustran en la gráfica anterior. Como un dato: Finlandia es el poseedor del sistema de educación mejor reconocido en Europa.
Universidad Abierta y a Distancia de México
23
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Figura 3. Revista Madrimas #47 (Junio 2008, España).
Para tener una visión global de la participación de la estadística inferencial se presenta un documento donde se manejan 3 casos típicos: Universidad de Entre Rios (septiembre, 2007). Inferencia estadística. Facultad de ingeniería, Argentina. Recuperado de: http://www.bioingenieria.edu.ar/academica/catedras/metestad/infere ncia.pdf
Actividades La elaboración de las actividades estará guiada por tu docente en línea, mismo que te indicará, a través de la Planeación didáctica del docente en línea, la dinámica que tú y tus compañeros (as) llevarán a cabo, así como los envíos que tendrán que realizar.
Para el envío de tus trabajos usarás la siguiente nomenclatura: BIBP2_U2_A1_XXYZ, donde BIBP2 corresponde a las siglas de la asignatura, U2 es la unidad de Universidad Abierta y a Distancia de México
24
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
conocimiento, A1 es el número de actividad, el cual debes sustituir considerando la actividad que se realices, XX son las primeras letras de tu nombre, Y la primera letra de tu apellido paterno y Z la primera letra de tu apellido materno.
Autorreflexiones Para la parte de autorreflexiones debes responder las Preguntas de Autorreflexión indicadas por tu docente en línea y enviar tu archivo. Cabe recordar que esta actividad tiene una ponderación del 10% de tu evaluación. Para el envío de tu autorreflexión utiliza la siguiente nomenclatura: BIBP2_E2_ATR _XXYZ, donde BIBP2 corresponde a las siglas de la asignatura, E2 es la unidad de conocimiento, XX son las primeras letras de tu nombre, y la primera letra de tu apellido paterno y Z la primera letra de tu apellido materno.
Cierre de la unidad La investigación finalmente solo será aplicada en función de la confianza y seguridad que brinden sus descubrimientos, se necesita que la repetitividad sea una característica que permita a los desarrolladores aplicar en forma directa los procesos y métodos descubiertos, todo esto solo se puede lograr cuando la estadística ha formado parte del proceso de descubrimiento o de desarrollo en forma continua y bien diseñada. Como una observación final, la estadística es la herramienta de enlace entre los investigadores y los productores, gracias a la cual se tiene un lenguaje común con la suficiente claridad para evitar errores subjetivos y delimitar objetivamente los resultados. La siguiente parte consiste en poner en práctica lo aprendido en las unidades 1 y 2, se relazará un procedimiento básico de investigación donde se utilizaran los principales conceptos y procesos de una investigación formal.
Universidad Abierta y a Distancia de México
25
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Fuentes de consulta
Cochran, W.G. (2000). Diseños experimentales. México: trillas. Castillo Morales, A. (2013). Estadística aplicada: población, muestra y datos, variables cualitativas y cuantitativas. México: Trillas Lopez K., L. (S. F.). Bioestadística. Colombia: Universidad Nacional de Colombia.
Bibliografía complementaria Bacchini, R., Vázquez, l. (2007). Estadística probabilidad e inferencia utilizando y Excel y SPSS. Buenos aires, Omicron Editorial.
Fuentes cibregráficas UNAM (2013). Estadística básica. México. Recuperado de: http://arquimedes.matem.unam.mx/lite/2013/1.1_Un100/ProbabilidadYEstadistica.html SERGAS (2006). Tipos de distribuciones. España. Recuperado de: http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/4ayuda%20Distribuciones%20de%20probabilidad.pdf Universidad Nacional de Lujan (2009). Diseño de experimentos. Argentina. Recuperado de: http://www.unlu.edu.ar/~estadistica/Diseno_de_experimentos.pdf
Universidad Abierta y a Distancia de México
26
U2
Ingeniería de bioprocesos II Estadística aplicada a la investigación
Casos y ejemplos de diseño factorial Análisis factorial http://ciberconta.unizar.es/LECCION/factorial/FACTORIALEC.pdf Introducción al sistema Renina- Angiotensina- Aldosterona http://www.medicinabc.com/2013/10/sistema-renina-angiotensinaaldosterona.html#axzz37Zq1lmwS Ruiz, Miguel Ángel, Pardo, Antonio (Enero, 2001). Análisis factorial con SPSS. Universidad Complutense de Madrid, recuperado de: (http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/materiales/an alisis_datosyMultivariable/20factor_SPSS.pdf) Universidad de Entre Rios (septiembre, 2007). Inferencia estadística. Facultad de ingeniería, Argentina. Recuperado de: http://www.bioingenieria.edu.ar/academica/catedras/metestad/inferencia.pdf Medina Gual, Luis (agosto, 2013).Introducción a la inferencia estadística [archivo de video]. Consultado en: http://youtu.be/RNVSr18Xz7s Medina Gual, Luis (febrero, 2013). Medidas de tendencia central [archivo de video]. Consultado en: http://youtu.be/2E-nSR8q6KI Medina Gual, Luis (marzo, 2013). Medidas de dispersión [archivo de video]. Consultado en: http://youtu.be/o5bq8jRuq5E Baronumaes (mayo, 2012). Bioestadística: teorema del límite central [archivo de video]. Consultado en: http://youtu.be/xZmFqLHIFJk Hernández, Evelio (noviembre, 2012). Intervalos de confianza [archivo de video]. Consultado en: http://youtu.be/EsAGiLv8qVE Monardes, C. (noviembre, 2012). Pruebas de hipótesis [archivo de video]. Consultado en: http://youtu.be/oBImHXNU41Q Silva, E (abril, 2013). Diseño factorial [archivo de video]. Consultado en: http://youtu.be/bMU8oDYKOhM Arriola Guillén, L. E. (octubre, 2012). Diseños experimentales [archivo de video]. Consultado en: http://youtu.be/HBWg8EMj7AM Universidad Abierta y a Distancia de México
27