Diplomado Investigación Científica 08/09/08
UNIDAD 6 Quien hace puede equivocarse, quien no hace ya está equivocado DANIEL KON
ORDENES ESTADÍSTICA DESCRIPTIVA CON EXCEL El objetivo de ésta unidad es utilizar los procedimientos estadísticos descriptivos ofrecidos por el programa EXCEL con el fin de agilizar los cálculos matemáticos presentados en las unidades precedentes y mostrar otras herramientas de apoyo que brinda el programa. Por lo tanto, en alguna medida se requiere la lectura de las primeras unidades para optimizar el aprovechamiento de ésta. Luego de acceder al programa (Inicio + Programas + EXCEL) Los procedimientos estadísticos no se activan cuando se instala el programa de Microsoft Excel, para ello se requiere activar la subrutina BVA que se encuentra en el menú Herramientas + complementos + BVA. Luego de éste paso, aparece en el menú Herramientas la opción Análisis de Datos.
ANALISIS EXPLORATORIO DE DATOS CON EXCEL Luego de colocar Análisis de Datos, se pueden calcular algunas medidas resumen, además, de otros procedimientos más avanzados, que sin embargo, requieren de algunos supuestos que no están implementados en la hoja de cálculo. A continuación se describe la manera de llegar a encontrar las medidas estadísticas más usuales. Para activar la orden que calcula dichas medidas, se activa la opción Análisis de Datos del menú Herramientas, mostrando lo siguiente:
En cualquier caso, el primer paso ha desarrollar en el análisis estadístico es llevar a cabo el análisis exploratorio de los datos, para lo cual se sugiere la siguiente estructura:
Preparado: León Darío Bello P. Universidad Cooperativa de Colombia
1
Diplomado Investigación Científica 08/09/08
Tipo de variable Cualitativa
Procedimiento
Objetivo
Frecuencias simples
Detectar errores en la digitación, códigos no validos. Estadísticas Detectar valores atípicos y extremos, descriptivas, gráficos de validar supuestos de normalidad. tallo y hojas – caja y sesgo, prueba de normalidad.
Cuantitativa
Lo anterior es fundamental, ya que, en caso contrario se podrían realizar procedimientos y por ende interpretaciones erróneas, debido a la no cualificación de los datos. Algunos problemas que se detectan con esta metodología son: errores de digitación, valores atípicos y/o extremos. Un esquema general para procesar datos se muestra en la figura siguiente:
PROCESAMIENTO DE DATOS E D IC IO N E L IM IN A R E R R O R E S DE CAM PO
C O D IF IC A C IO N P R E G U N T A S A B IE R T A S C ER R A D A S
V E R IFIC A C IO N D E R E S P U E S T A S D A TO S FA L TA N T E S U N IF O R M A R C R I T E R IO S
E S C A L A S D E M E D IC I O N
D IG I T A C IO N B A SE S D E D AT OS T R A N S F O R M A R D A TO S A N A L I S IS E X P L O R A T O R IO D E D A T O S
D IA GR A MA S T A LL O Y H OJA S C A J A Y B IG O T E S
P LAN D E A N ALISIS A N A L IS IS D E D A T O S
N O M IN A L O R D IN A L IN TER V AL O
A N AL IS IS DE S CR IP T IVO
A N A L I S I S IN F E R E N C I A L
U N I V A R IA D O
U N IV A R I A D O
R AZO N
B I V A R IA D O
B IV A R I A D O
M U L T I V A R IA D O
M U L T IV A R I A D O Material p reparado por: Profesor León Darío Bello Parias
Luego de realizar el análisis exploratorio y los ajustes necesarios, se procede a desarrollar el plan de análisis el cual es un paso previo al procesamiento de datos. El siguiente pantallazo muestra un ejemplo con 5 variables: 3 cualitativas y 2 cuantitativas, además, de los códigos necesarios para ejecutar las frecuencias. El objetivo es identificar si las variables presentan errores o problemas para su posterior análisis.
Preparado: León Darío Bello P. Universidad Cooperativa de Colombia
2
Diplomado Investigación Científica 08/09/08
El cálculo de las frecuencias simples en Excel se realiza de la siguiente forma: Herramientas + Análisis de Datos + Histograma, mostrando lo siguiente:
Se entiende como rango de entrada, las celdas donde se encuentran los datos sin tabular, el rango de celdas son los códigos correspondientes a la variable objeto de estudio, el Preparado: León Darío Bello P. Universidad Cooperativa de Colombia
3
Diplomado Investigación Científica 08/09/08
rango de salida es la celda donde se quieren los resultados. Esta forma de trabajar el Excel es igual para todos los procedimientos, variando obviamente, según el método utilizado. Los resultados encontrados para las 3 variables son:
Los resultados muestran como para la variable sexo, no hubo valores anormales, mientras que para las preguntas P1 y P2, se encontraron códigos fuera del rango de la variable. Por lo tanto, toca revisar los datos originales o en su defecto eliminarlos. El análisis exploratorio de datos cuantitativos, se realiza así: Herramientas + Análisis de Datos + Estadística descriptiva, mostrando lo siguiente:
Preparado: León Darío Bello P. Universidad Cooperativa de Colombia
4
Diplomado Investigación Científica 08/09/08
El objetivo es detectar valores fuera de lo común, para ello se hace una reflexión sobre los valores máximo y mínimo de los datos, además, del promedio y la desviación típica, así, como de los diferentes estadísticos. Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta
Edad Nota crédito 20,72727273 3,63636364 0,428335236 0,31486584 20 3,5 20 3,5 1,420627262 1,04429184 2,018181818 1,09054545 -0,794578362 6,55459808 0,585538412 2,28805964 4 4 19 2,5 23 6,5 228 40 11 11
La variable edad presenta valores que se pueden considerar normales para la variable objeto de estudio, ya que el valor máximo es 23 y el mínimo es 19, mientras que en la nota crédito, se observa un valor fuera del rango posible de los datos (6.5), lo que impide seguir en el análisis sin antes corregir el problema. Luego de garantizar la calidad de los datos, se pueden realizar las interpretaciones pertinentes. Ejercicio: Realice el análisis exploratorio para los siguientes datos, calcule las estadísticas resumen e interprete los resultados encontrados.
Preparado: León Darío Bello P. Universidad Cooperativa de Colombia
5